Анализ первичных последовательностей и самоорганизация сополимеров тема автореферата и диссертации по химии, 02.00.06 ВАК РФ

Гусев, Леонид Владимирович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2005 ГОД ЗАЩИТЫ
   
02.00.06 КОД ВАК РФ
Диссертация по химии на тему «Анализ первичных последовательностей и самоорганизация сополимеров»
 
Автореферат диссертации на тему "Анализ первичных последовательностей и самоорганизация сополимеров"

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

АНАЛИЗ ПЕРВИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ И САМООРГАНИЗАЦИЯ СОПОЛИМЕРОВ

Специальности: 02.00.06 - высокомолекулярные соединения

01.04.07 - физика конденсированного состояния

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

имени М.В. Ломоносова

ФИЗИЧЕСКИЙ ФАКУЛЬТЕТ

На правах рукописи

Гусев Леонид Владимирович

Москва 2005

Работа выполнена на кафедре физики полимеров и кристаллов физического факультета Московского государственного университета имени М.В, Ломоносова

Научные руководители:

академик РАН, профессор Хохлов Алексей Ремович

доктор физико-математических наук Василевская Валентина Владимировна

Официальные оппоенты:

доктор химических наук Кучанов Семен Ильич

доктор физико-математических наук, профессор Шайтан Константин Вольдемарович

Ведущая организация:

Институт химической физики имени Н.Н. Семенова РАН

Защита состоится J8_ июня 2005 года в 16-30 на заседании Диссертационного Совета Д.501.002.01 в Московском государственном университете по адресу: 119992, ГСП-2, Москва, Ленинские Горы, МГУ им. М.В. Ломоносова, физический факультет, Южная физическая аудитория.

С диссертацией можно ознакомиться в библиотеке физического факультета МГУ им. М.В. Ломоносова.

Автореферат разослан 5 мая 2005 г. Ученый секретарь

Диссертационного совета Д.501.002.01 в Московском государственном универаИтэт'°

кандидат физико-математических наук

Общая характеристика работы

Актуальность работы.

Последние десять лет в научном мире можно без сомнения назвать временем нанотехнологий и наноматериалов. Для создания материалов, содержащих наноразмерные домены, используются блоксополимеры, где отталкивание различных блоков приводит к самоорганизации макромолекул в микроструктуры с различной морфологией (сферы, цилиндры, ламели) размерами от 10 до 1000 А. Микрофазным расслоением в таких системах можно эффективно управлять, варьируя длины соответствующих блоков в последовательности. В последнее время для создания функциональных полимерных материалов используют вместо обычных блоксополимеров полимеры более сложной архитектуры, такие как гребнеобразные полимеры или сополимеры, состоящие из гребнеобразного и линейного блоков. Другим эффективным способом управления микрофазным расслоением в расплавах сополимеров может являться использование сополимеров со специфическими последовательностями мономерных звеньев, при которых обеспечивается стабильность микрофазного расслоения в заданном интервале физических параметров системы.

Свойства гетерополимерных молекул - как синтетических, так и биологических - во многом определяются распределением мономерных звеньев вдоль по последовательности, их первичной структурой. На данный момент самыми сложными по своим функциональным свойствам являются биологические полимеры (ДНК, РНК, белки). При анализе первичной структуры таких макромолекул они часто представляются в виде двухбуквенных последовательностей путем соответствующей перекодировки. В случае белков все аминокислотные остатки разбиваются на две группы -

гидрофобные и гидрофильные, и белковая макромолекула представляется как сополимер из двух сортов мономерных звеньев. Такое представление позволяет выявить основные закономерности в чередовании групп данного сорта и сделать выводы о возможной пространственной структуре биополимера и функциях закодированных в его последовательности, что, несомненно, важно как для понимания процессов жизнедеятельности клетки, так и для возможного воспроизведения этих механизмов в искусственных полимерных системах.

Целью данной диссертационной работы был поиск оптимальных процедур, позволяющих эффективно анализировать сложные последовательности и путем варьирования архитектуры и последовательности конструировать полимерные материалы с заданным масштабом микронеоднородностей, стабильных в широком интервале физических параметров системы.

Научная новизна работы определяется прежде всего тем, что большинство рассмотренных задач исследовались впервые. В результате изучения этих задач было предсказано существование ряда новых эффектов, некоторые из которых уже обнаружены экспериментально. Методы анализа первичной структуры биологических и модельных последовательностей, предложенные в данной диссертационной работе, нигде ранее не использовались и поэтому позволяют взглянуть на свойства биологических последовательностей с принципиально новой точки зрения.

В представленной работе

• впервые предложена эффективная методика сегментации и идентификации двухбуквенных АВ последовательностей с

различной статистикой распределения звеньев А и В;

• впервые предложен и апробирован метод анализа белковых последовательностей как текстов, написанных на «белковом» языке, не содержащий никаких дополнительных предположений о сложности и структуре белковых «текстов»;

• впервые построена теория микрофазного расслоения в расплавах блоксополимеров, состоящих из линейного и гребнеобразного блоков, сильно несовместимых друг с другом;

• впервые предложен способ эффективного подбора последовательностей сополимеров, формирующих в расплавах микронеоднородности заданного масштаба, стабильные в определенном температурном интервале.

Практическая ценность работы обусловлена тем, что полученные результаты найдут применение в самых различных областях науки. В нанотехнологии - для создания материалов с заданной микроструктурой. В биоинформатике - в качестве новых методов сегментации и идентификации биологических последовательностей.

Структура и объем работы. Диссертация состоит из введения, пяти глав, выводов и списка цитируемой литературы из 87 наименований. Диссертация содержит 108 страниц, включая рисунки, оглавление и список литературы.

Публикации. По результатам данной диссертационной работы опубликованы три статьи в реферируемых журналах (двух международных и одном российском).

Апробация работы. Основные результаты диссертации докладывались на пяти студенческих конференциях, проводимых «Учебно-научным центром по химии, физики полимеров и тонких органических пленок», а также на восьми международных конференциях и симпозиумах: Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Солнечногорск, 2004; «Modern Trends in Organoelement and Polymer Chemistry» International Conference Dedicated to 50th Anniversary of A.N. Nesmeyanov Institute of Organoelement Compounds, Russian Academy of Sciences, Москва, 2004; Третья Всероссийская Каргинская конференция «Полимеры - 2004», Москва, 2004; Moscow Conference on Computational Molecular Biology, Москва, 2003; Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Тверь, 2003; Международная конференция студентов, аспирантов и молодых ученых по фундаментальным наукам «Ломоносов-2003», секция физика, Москва, 2003; 4th International Conference «Molecular Order and Mobility in Polymer Systems», Санкт-Петербург, 2002; Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Дубна, 2002; Российско-германский семинар «Computer Simulation of Macromolecular Systems: Dense States of Semiflexible Macromolecules and Copolymers», Москва, 2002; Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Пущино, 2001; Российско-германская конференция «Self-Assembly Processes in Complex Macromolecular Systems in Solutions and at Interfaces», Москва, 2001; Europolymer Congress, Эйндховен, 2001; Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Санкт-Петербург, 2000.

ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении к диссертации обоснована актуальность темы исследований, сформулированы цели и задачи работы.

Первая глава диссертации посвящена обзору литературы по тематике работы и состоит из трех частей. Первая часть посвящена изложению основных теоретических моделей, используемых при описании микрофазного расслоения в расплавах блоксополимеров. Приводятся результаты экспериментов, имеющих отношение к рассматриваемым явлениям. Во второй части освещается метод конформационно-зависимого синтеза первичной последовательности сополимеров, приводятся результаты теоретического исследования таких макромолекул. Третья часть посвящена изложению основных численных методов анализа первичных последовательностей биологических полимеров. Приводятся методы анализа как двухбуквенных, так и многобуквенных последовательностей.

Главы 2-5 содержат оригинальные результаты.

Во второй главе разработана методика идентификации (распознавания) цепи с различными статистиками размещения звеньев в двухбуквенных последовательностях, а также процедура, позволяющая с максимальной точностью определять границу между различными участками двухбуквенной последовательности.

В качестве исходной модели был рассмотрен сополимер мономерных звеньев двух сортов А и В. Полимерная цепь была составлена из участков (подпоследовательностей), отличающихся между собой по составу и/или по статистическим свойствам. Состав участка цепи длиной Ь звеньев характеризуется долей мономерных звеньев А в этом участке цепи:

где ЬдпЬв- полное число мономерных звеньев сорта А И В.

Соответственно, доля мономерных звеньев сорта .В: \-fi-При одинаковых составах сополимерных последовательностей звенья А и В могут быть распределены различными способами. Это может быть случайная (бернуллиевская), регулярная, случайно-блочная (пуассоновская) или какая-нибудь более сложная статистика распределения мономерных звеньев в последовательности (например, статистика «полета Леви», распределение которому подчиняются длины блоков в белковоподобном сополимере). При случайном распределении мономерные А и В звенья распределены вдоль полимерной последовательности независимо с вероятностью определяемой составом полимера. В случае регулярного сополимера звенья А и В размещаются блоками, а длины блоков А и В не изменяются и постоянны вдоль по цепи. При случайно-блочном распределении и распределении «полета Леви» А и В мономеры также собираются в блоки, состоящие из однотипных звеньев, но их длины не постоянны, а подчиняются соответствующим законам распределения.

Для того, чтобы применить численные методы анализа последовательностей, полученные нами гетеропоследовательности звеньев А и В были перекодированы в численные последовательности согласно правилу:

1, для звеньев А

-1, для звеньев В

Для проверки эффективности различных методов сегментации нами были смоделированы последовательности, состоящие из подпоследовательностей с различными составами и статистикой распределения звеньев. Определение границы между подпоследовательностями мы проводили следующими методами:

1) по изменению текущего состава последовательности;

2) по изменению средней длины блока из мономерных звеньев одного сорта;

3) по изменению вида сегментационной функции;

4) методом поиска максимума функции дивергенции Йенсона-Шеннона.

Было показано, что первый метод эффективен при сегментации гетеропоследовательности, составленной из подпоследовательностей различного состава; второй - если последовательность состоит из подпоследовательностей с сильно отличающимися значениями средних длин блоков А и В.

Более сложной является ситуация, когда у обеих подпоследовательностей одинаковы составы и средние значения длин блоков А и В. Для сегментации таких последовательностей мы ввели функцию 5'(к,Ь), сходную с функцией взаимной информации, и названную нами сегментационной функцией:

!) = /11пЛ + (1-ЛМ -ЛЬ IУ*(к) 1ПРЧк), (3)

где доля звеньев А на участке цепи длиной - это вероятность

того, что наугад выбранный отрезок гетеропорледовательности длины к начинается звеном и заканчивается звеном В нашем случае принимают значения 1 или -1. Таким образом это вероятность того, что любой сегмент длины имеет на своих концах звенья типа а - это

вероятность того, что отрезок имеет на концах и= -1 и т.д.

Легко получить аналитическое выражение для функции 3(к,Ь) случайной последовательности. В этом случае функция является

константой, зависящей только от состава

Значение сегментационной функции 3(к,Ь) случайного сополимера максимально для сополимера, содержащего одинаковые количества звеньев А и В (/¡,=0.5), и оно уменьшается по мере отклонения состава от равновероятного^ЦХб.

Аналитически нами также была рассчитана сегментационная функция регулярного сополимера с фиксированными длинами п^ И ПдА и В блоков (п4 >пв). Показано, что сегментационная функция такой последовательности - это периодическая функция с периодом Пд+Пв- Можно выделить три различные области поведения функции

Для значений параметра к в интервале (¡<к<па сегментационная функция принимает следующее значение:

(5)

В промежутке значений п„ <к<пА сегментационная функция не зависит от значений величины к и является константой:

*(*,£) = сот = /£ 1п/, -(1-Л)1п(1-Л)-(2/, - 1)1п(2Л -1). (6)

При сегментационная функция задается

следующим образом:

=Л ь»Л +0-Л)1п0 -Л)-<—:—1+Л)1п(——1+Л)-

-(—---Л)1п(—к— Л)-2| 1

«А+П3

»А+ПВ к

п. +п„

п.+п.

1п 1 —

п.+пИ

(7)

На рисунке 1а представлен характерный вид сегментационной функции регулярного сополимера а на рисунке 1б частный случай для

регулярного сополимера с равными длинами блоков

Рисунок 1. Сегментационная функция $(к£) регулярной последовательности: "л > пв (а), »а = "в (б)

Сегментационная функция случайно-блочного сополимера (рис.

2а) является осциллирующей функцией, максимальные значения которой ложатся на прямую, положение которой зависит от состава сополимера, а период осцилляции определяется значением средней длины блока.

В случае белковоподобной последовательности (рис. 26) сегментационная функция 8(к,Ь) достаточно резко растет при малых к, а затем выходит на постоянное значение, соответствующее значению случайного сополимера такого же состава. Скорость роста зависит от средней длины блока в последовательности. Отметим, что сегментационная функция

белковоподобной последовательности выходит на плато уже при сравншельно небольших значениях к (начиная С ¿=10). Связано это с тем, что в белковоподобной последовательности присутствует большое число коротких блоков, а само распределение длин блоков очень широкое, что и позволяет говорить о квазислучайном распределении гидрофильных и гидрофобных групп в таких сополимерах.

Полученные нами результаты были применены для сегментации сложных последовательностей и распознавания статистики участков, из которых она состоит. В качестве модельной АВ гетеропоследовательности мы рассмотрели последовательность, составленную из случайного, случайно-блочного и белковоподобного участков. Все подпоследовательности содержали одинаковое число А и В мономерных звеньев, а средние длины блоков в случайно-блочной и в белковоподобной последовательностях были равны друг другу: /п=/,.2-/м= 0.5 И {пп) = {пл^ = 22. Па рисунке За

приведена зависимость сегментационной функции на участке

последовательности длины !, начинающемся в х звене.

Рисунок 3. Сегментационная функция ¡(к,1,х) (а) и дивергенция Йенсона-Шеннона С(11,1г) (б) последовательности, составленной из случайной, блочно-случайной и белковоподобной подпоследовательностей. Вертикальными линиями показаны точки сшивки подпоследовательностей.

Визуальный анализ сегментационной функции позволяет легко

отличить участки последовательности с различной статистикой (рис. За). Так, горизонтальное плато (х=1-10000) соответствует случайной последовательности. Участок с волновым поведением функции 5{к,1,х) соответствует последовательности с пуассоновской статистикой распределения мономерных звеньев. Вид функции 8(к,1,х) на участке х=20000-30000 показывает, что это белковоподобная последовательность.

Для определения границ между подпоследовательностями с точностью до нескольких мономерных звеньев нами был использован энтропийно-сегментационный метод, основанный на вычислении дивергенции Йенсона-Шеннона 0(1,1), являющейся функцией координаты точки //, делящей последовательность на две части:

(8)

где - энтропия Шеннона.

В качестве элементарного слова нами были рассмотрены блоки из одноименных символов, а соответственно в качестве вероятностей - частоты встреч таких блоков в каждой части последовательности:

(9)

где Р{п) - вероятность встречи блока длины п А или В символов.

На рисунке 36 представлена зависимость дивергенции Йенсона-Шеннона от координаты, вдоль по последовательности точки для

вышеописанной гетеропоследовательности. Видно, что в точках сочленения подпоследовательностей (обозначены вертикальными линиями) дивергенция С(1],1т) достигает четко выраженного максимума. Ошибка определения границы между подпоследовательностями в данном методе не превышает нескольких мономерных звеньев (от 3 до 10).

С(/„/г) = Я(£)-

1±Н(1,)Лщ2)

и

Метод, предложенный нами для сегментации модельных последовательностей, был применен для сегментации последовательностей, составленных из последовательностей реальных белков. В качестве примера мы рассмотрели гетеропоследовательность, составленную из последовательностей глобулярного белка рибонуклеаза и фибриллярного белка эластин (коды белков взяты из базы данных GenBank). Рассмотренные белки сильно отличаются друг от друга по функциональным свойствам и имеют различную третичную структуру. Так белок рибонуклеаза имеет хорошо выраженную глобулярную структуру, в то время как эластин не обладает четко выраженной пространственной структурой. Длины же их почти совпадают: длина последовательности белка эластин составляет 860 звеньев, а длина белка рибонуклеаза - 844 мономерных звена. Полученную гетеропоследовательность аминокислот мы перекодировали в двухбуквенную последовательность по следующему правилу: м,=1 для аминокислотных остатков с полярными или заряженными группами, для

аминокислотных остатков с неполярными или ароматическими группами.

а) б)

Рисунок 4. Сегментационная функция 5(к,1^х) (а) и дивергенция Йенсона-Шеннона СОМ (б) последовательности, составленной из подпоследовательностей фибриллярного белка эластин и глобулярного белка рибонуклеаза. Вертикальной линией показана точка сшивки подпоследовательностей.

На рисунке 4 представлены сегментационная функция 5(к,1,х) (а) и

дивергенция Йенсона-Шеннона С(/,,/2) (б) такой гетеропоследовательности. Хорошо видно, что вблизи точки сочленения двух подпоследовательностей вид сегментационной функции меняется очень сильно: ниже точки сочленения поверхность плоская (случайное распределение), после

прохождения точки сочленения поверхность волнообразная

(случайно-блочное распределение). Максимум на графике функции дивергенции Йенсона-Шеннона практически совпадает (с точностью

до 2-х мономерных звеньев) с точкой сшивки последовательностей.

В третьей главе белковые последовательности были проанализированы как тексты, написанные на «белковом» языке. Для выделения повторяющихся «слов» в таких последовательностях нами была предложена оригинальная методика, апробированная в ходе анализа (разбиения на «слова») англоязычных текстов, записанных в виде непрерывной буквенной последовательности, не содержащей знаков препинания.

Рассмотрим произвольную текстовую последовательность длины N букв из Q буквенного алфавита. Любую связанную подпоследовательность длины п из рассматриваемой последовательности назовем «словом», если она встречается в тексте хотя бы два раза.

Разбиение последовательности (текста) на «слова» может быть произведено различными способами.

Первый наивный метод - это метод последовательного выделения «слов» из текста, начиная с самых длинных. В тексте находятся самые длинные повторяющиеся подпоследовательности (как правило, их две). Эти последовательности считаются «словами», они выделяются. Далее анализируется оставшийся текст (или вернее оставшиеся участки текста), в котором находят более короткие повторяющиеся последовательности -«слова». Отметим, что при этом полученные после выделения «слов» участки текста рассматриваются как отдельные значимые структурные единицы:

после выделения «слов» они не объединяются в новый текст, и все возможные «слова» в них сравниваются между собой.

Более сложный метод заключается в первоначальном определении всех i возможных «слов» различных длин п и последовательностей букв в тексте; вычислении частоты встречаемости каждого «слова» р'„ и его веса w¡\ и последовательном выделении из текста «слов», имеющих наибольший текущий вес.

Мы рассмотрели два определения веса «слова»: простой вес «слова», определенный нами как произведение частоты встречаемости «слова» на его длину: и квадратичный вес, равный произведению частоты

встречаемости «слова» на квадрат его длины:

Публикации в Художественные Статьи из научных Научные тексты газетах книги журналов

Тип текста

Рисунок 5. Доля правильно выделенных «слов» для текстов, проанализированных методом, учитывающим квадратичный вес «слова»: Щ -публикации в газетах, § - художественные книги, - статьи из научных журналов, - научные тексты.

Анализ показал, что наиболее эффективным является метод разбиения текста с учетом квадратичного веса «слова», который позволяет правильно выделить в тексте практически все важные повторяющиеся «слова» и словосочетания

На рисунке 5 представлены доли правильно выделенных «слов» в газетных публикациях, в художественных текстах, в статьях из научных журналов и книг. Видно, что доля правильно выделенных «слов» в текстах достаточна велика Она составляет от 75 % до 85 %

Используя процедуру выделения «слов» с учетом их квадратичного веса, мы проанализировали ряд белковых последовательностей, данные о которых были взяты из базы данных Genbank.

Белок

Рисунок 6. Максимальная длина «слова» п^ для различных белков. | фибриллярные белки, | - глобулярные белки, - мембранные белки.

На рисунке 6 приведены значения длин птал «слов» с максимальным квадратичным весом «слова» (максимальных «слов») для различных

белков, расположенные по мере уменьшения веса, где разным способом помечены данные для различных групп белков: фибриллярных, мембранных и глобулярных. Видно, что длины Пщах максимальных «слов» в фибриллярных белках, как правило, достаточно велики: они изменяются в интервале от 7 до 30 букв и больше, чем характерные длины п^ максимальных «слов» для мембранных и глобулярных белков. Можно также отметить, что характерные длины максимальных «слов» в глобулярных белках, будучи близки к соответствующим величинам мембранных белков, все же несколько выше. Так, длины максимальных «слов» глобулярных белков варьируются от 4 до 7 букв; а длины максимальных «слов» мембранных белков - от 3 до 6 букв.

В четвертой главе представлена теория микрофазного расслоения в расплаве диблоксополимера, состоящего из гребнеобразного А и линейного В блоков.

Гребнеобразный блок А характеризуется степенью полимеризации его остова Ыц, степенью полимеризации привитых (боковых) цепей п и расстоянием между точками пришивки т. Блок В характеризуется его степенью полимеризации

а) б)

Рисунок 7. Схематичное представление микроструктур, образованных гребнебнеобразным диблоксополимером: - сферическая (а) и - ламелярная (б) структуры.

Блоки А ТА В несовместимы друг с другом. Предположим, что несмешиваемость между ними настолько сильна, что в расплаве они образуют

микроструктуры в соответствии с режимом сильной сегрегации (рис. 7).

Нами была предложена соответствующая теория и показано, что в случае, когда длина Л/а блока А много меньше длины Л^ блока В (Ла<:<Лгв)> блоки А формируют сферические мицеллы радиуса Я с агрегационным числом Q:

(10)

01)

где контурная длина блока - длина

сегмента Куна и площадь мономерного звена блока А и В, соответственно, - коэффициент поверхностного натяжения на границе А и В

блоков.

Видно, что при больших значениях параметра ть агрегационное число Q в целом не зависит от структурных параметров блока В. В этом случае параметр в, с обычными значениями 1ц и будет стремиться к единице. Такой результат вполне объясним. С увеличением ть радиус Я мицеллы А увеличивается (рис. 7) и плотность линейных В блоков вблизи поверхности А мицелл падает. В результате, при достаточно больших значениях вклад Раи^в становится незначительным по сравнению со свободной энергией /^„ул А блока.

С увеличением степени несмешиваемости у обе величины, агрегационное число и радиус мицеллы растут вплоть до перехода в режим сверхсильной сегрегации, где размер мицеллы сравним с длиной полностью вытянутого остова гребнеобразного А блока:

Простые вычисления позволяют оценить критическое значение — I в точке

(и1!

перехода из режима сильнои сегрегации в режим сверхсильнои сегрегации:

(13)

м

V Шк 40

При

кТ \кТ)&

(режим сверхсильнои сегрегации) размер мицеллы

есть линейная функция контурной длины Ь^ гребнеобразного блока А, его значение как и значение агрегационного числа не увеличивается с понижением температуры:

(14)

Из (14) и (15) следует, что критическое значение

(«Х

и агрегационное число

Q¡, в режиме сверхсильной сегрегации обратно пропорциональны величине ть. Т.е., чем больше степень полимеризации боковых блоков и их плотность пришивки, тем меньше агрегационное число мицелл в режиме

сверхсильной сегрегации и тем меньше параметр несовместимости при котором происходит переход из режима сильной сегрегации в режим сверхсильной.

Было показано, что характерный размер структуры Я и критическое

значение

перехода в режим сверхсильной сегрегации для случая

ламелярных и цилиндрических структур имеют те же скейлинговые зависимости, что и для сферических мицелл.

Пятая глава посвящена конструированию последовательностей сополимеров, образующих в расплавах микронеоднородности заданного масштаба, стабильные в заданном температурном интервале.

В данной главе мы использовали эволюционный метод конструирования последовательностей, являющийся модификацией метода конформационно-зависимого синтеза. В отличие от оригинального метода, в котором в качестве «эволюционного давления» применяется потенциальная энергии системы, мы в качестве такого давления использовали температуру микрофазного расслоения. Под «эволюцией» последовательности понимали следующую процедуру. На первом шаге эволюции генерировали случайную АВ гетеропоследовательность длины L (мы рассмотрели последовательности разной длины: ¿=16; 32; 64; 128; 256; 512) и вычисляли температуру микрофазного расслоения расплава таких молекул. На следующем шаге последовательность подвергали точечной мутации: в последовательности случайным образом выбирали два мономерных звена и меняли их местами. После этого вновь производили вычисление температуры микрофазного расслоения расплава уже модифицированных макромолекул. Если она оказывалась больше, чем температура микрофазного расслоения до мутации, то мутация нами принималась, если нет, то мутация принималась с

вероятностью это температура

микрофазного расслоения расплава до и после мутаций, а а- это коэффициент пропорциональности, определяющий скорость мутаций.

В ходе эволюционной процедуры, включающей в себя уравновешивание системы на 2x105 временных шагах, мы получили нетривиальные зависимости температуры микрофазного расслоения и масштаба микронеоднородностей возникающих в системе при

микрофазном расслоения, от значений параметра

На рисунке 8 представлена зависимость температуры микрофазного расслоения Т"* от параметра а. Хорошо видно, что с понижением значений параметра максимальная температура при которой наблюдается

микрофазное расслоение, увеличивается, причем при а я 0 7 она претерпевает скачок, амплитуда которого растет с ростом длины последовательности Ь.

200

100

150

-•-1-16 -•-1=32 -ж-1=64 -т-1=128 -<-1=256 -►-1=512

50

О

001

01

а

Рисунок 8. Зависимость температуры микрофазного расслоения Г* от значений параметра а.

При а <. 0 1 последовательность соответствует правильному или слабо дефектному (блоки которого содержат небольшие вкрапления звеньев другого сорта) диблоксополимеру, а для значений а 2: 1 статистическому сополимеру. Это означает, что с ростом значений параметра а происходит переход из упорядоченного состояния (диблоксополимера) в разупорядоченное состояние (случайная последовательность).

Расчеты показали, что максимальный масштаб микронеоднородностей наблюдается не в расплаве диблочника, а в расплаве слабо дефектного диблоксополимера, блоки которого содержат небольшую фракцию звеньев другого сорта.

В заключении приведены все основные результаты диссертации и положения, выносимые на защиту.

Основные результаты и выводы диссертации

1. Предложен и апробирован метод сегментации и идентификации бинарных последовательностей АВ сополимеров с различной статистикой распределения звеньев, основанный на расчете введенной нами впервые сегментационной функции и функции дивергенции Йенсона-Шеннона, вычисленной для энтропии Шеннона по отношению к вероятности встречи блока А или В длины п.

2. Разработана методика анализа белковых последовательностей как текста, написанного на «белковом» языке. Методика апробирована на англоязычных текстовых последовательностях. Показано, что в последовательностях белков действительно можно выделять повторяющиеся мотивы («слова») различных длин, и что максимальные длины «слов» различны для белковых последовательностей различных классов.

3. Построена теория микрофазного расслоения в расплаве диблоксополимера, состоящего из гребнеобразного и линейного блоков, сильно несовместимых между собой. Показано, что в широкой области изменения параметров макромолекулы характерный период структуры определяется параметрами гребнеобразного блока и практически не зависит от геометрических параметров линейного блока. При этом гребнеобразный блок достаточно сильно вытянут (степень его растяжения тем больше, чем выше плотность пришивки и длина боковых цепей). Показано, что в таких системах может возникнуть режим сверхсильной сегрегации вследствие предельной вытяжки гребнеобразного блока.

4. Предложена методика быстрого конструирования первичных последовательностей сополимеров, образующих в расплавах структуры с заданным масштабом микронеоднородностей и стабильных в заданном температурном интервале. Показано, что диблоксополимеры и слабо

дефектные диблоксополимеры претерпевают переход в микрофазное состояние при более высоких температурах, чем сополимеры с другими распределениями звеньев. Показано, что при фиксированном составе сополимера максимальный масштаб микронеоднородностей наблюдается в системе, формируемой слабо дефектными диблоксополимерами, в которых блоки содержат небольшую фракцию звеньев другого сорта.

Список публикаций по теме диссертации.

1. В.В. Василевская, Л.В. Гусев, А.Р. Хохлов "Белковые последовательности как «литературный» текст" - Доклады академии наук. Биохимия, Биофизика, Молекулярная Биология 2004, т. 397, стр. 235-238

2. L.V.Gusev, V.V. Vasilevskaya, VJu. Makeev, P.G. Khalatur and A. R. Khokhlov "Segmentation Of Heteropolymer Sequences Specifying Subsequences With Different Composition And Statistical Properties" -Macromol. Theory Simul. 2003, v.12, pp. 604-613

3. V.V.Vasilevskaya, L.V. Gusev, A.R. Khokhlov, O. Ikkala, G. ten Brinke, "Domains in Melts of Comb-Coil Diblock Copolymers: Superstrong Segregation Regime" - Macromolecules 2001, v.34, n.14, pp. 5019-5022

4. JI.B. Гусев, "Белковые последовательности как «литературный» текст" -Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Солнечногорск, 2004 (сборник тезисов докладов, стр. 21)

5. L.V. Gusev, V.V. Vasilevskaya, P.G. Khalatur, A.R. Khokhlov, "The application of Jensen-Shannon Divergence Measure for Segmentation of Protein Sequences" - "Modern Trends in Organoelement and Polymer Chemistry" International Conference Dedicated to 50th Anniversary of A.N. Nesmeyanov Institute of Organoelement Compounds, Russian Academy of Sciences, Moscow, 2004 (abstract book, p.27)

6. Л.В. Гусев, В.В. Василевская, А.Р. Хохлов, "Энтропийный метод сегментации белковых последовательностей" - Третья Всероссийская Каргинская Конференция «Полимеры - 2004», Москва, 2004 (сборник тезисов докладов, том 2, стр. 182)

7. L.V. Gusev, V.V. Vasilevskaya, P.G. Khalatur, A.R. Khokhlov, "Identification of Sequences With Different Statistical Properties" - Moscow Conference on Computational Molecular Biology, Moscow, 2003 (abstract book, p. 91)

8. Л.В. Гусев, "Распознавание и сегментация модельных и биологических последовательностей" - Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Тверь, 2003 (сборник тезисов докладов, стр. 18)

9. L.V. Gusev, V.V. Vasilevskaya, A.R. Khokhlov, G.ten Brinke, "Domains in Melts of Comb-Coil Diblock Copolymers: Superstrong Segregation Regime" - 4th International Conference "Molecular Order and Mobility in Polymer Systems", St.- Petersburg, 2002 (abstract book, p. 116)

10. Л.В. Гусев, "Сегментация гетеропоследовательностей" - Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Дубна, 2002 (сборник тезисов докладов, стр. 22)

11 .Л.В. Гусев, "Микрофазное расслоение в блоксополимерах, состоящих из гребнеобразного и линейного блоков" - Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Пущино, 2001 (сборник тезисов докладов, стр. 14)

12.Л.В. Гусев, "О режиме сверхсильной сегрегации в расплавах блоксополимеров, состоящих из гребнеобразного и линейного блоков" -Конференция студентов и аспирантов по химии и физике полимеров и тонких органических пленок, Санкт-Петербург, 2000 (сборник тезисов докладов, стр. 18)

ООП Физ ф-та МГУ. Заказ 70-100-05

vnmaup

950

09 НЮНЩ5

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Гусев, Леонид Владимирович

Содержание.

Введение.

1. Обзор литературы

1.1. Микрофазное расслоение.

1.1.1 Микрофазное расслоение в расплаве блоксополимеров.

1.1.2 Микрофазное расслоение в расплаве гребнеобразных блоксополимеров.

1.2. Конформационно-зависимый синтез полимеров.

1.3. Анализ биологических последовательностей.

1.4. Постановка основных задач работы.

2. Распознавание и сегментация двухбуквенных модельных и биологических гетеропоследовательностей

2.1. Постановка задачи.

2.2. Сегментация гетеропоследовательности, составленной из подпоследовательностей различного состава.

2.3. Сегментация гетеропоследовательности, составленной из подпоследовательностей с различными средними длинами блоков.

2.4. Сегментация гетеропоследовательности, составленной из подпоследовательностей с одинаковыми составами и одинаковыми средними длинами блоков.

2.5. Сегментация белковых последовательностей.

3. Белковые последовательности как литературный текст

3.1. Введение.

3.2. Метод исследования.

3.3. Результаты.

4. Микрофазное расслоение в гребнеобразных диблоксополимерах

4.1.Сферические мицеллы.

4.2.Ламеллярная структура.

5. Дизайн полимерных материалов с заданным масштабом микронеоднородностей

5.1. Постановка задачи.

5.2. Результаты.

 
Введение диссертация по химии, на тему "Анализ первичных последовательностей и самоорганизация сополимеров"

Актуальность работы.

Последние десять лет в научном мире можно без сомнения назвать временем нанотехнологий и наноматериалов. Для создания материалов, содержащих наноразмерные домены, используются блоксополимеры, где отталкивание различных блоков приводит к самоорганизации макромолекул в микроструктуры с различной морфологией (сферы, цилиндры, ламели) размерами от 10 до 1000 А. Микрофазным расслоением в таких системах можно эффективно управлять, варьируя длины соответствующих блоков в последовательности. В последнее время для создания функциональных полимерных материалов используют вместо обычных блоксополимеров полимеры более сложной архитектуры, такие как гребнеобразные полимеры или сополимеры, состоящие из гребнеобразного и линейного блоков. Другим эффективным способом ^ управления микрофазным расслоением в расплавах сополимеров может являться использование сополимеров со специфическими последовательностями мономерных звеньев, при которых обеспечивается стабильность микрофазного расслоения в заданном интервале физических параметров системы.

Свойства гетерополимерных молекул - как синтетических, так и биологических - во многом определяются распределением мономерных звеньев вдоль по последовательности, их первичной структурой. На данный момент самыми сложными по своим функциональным свойствам являются биологические полимеры (ДНК, РНК, белки). При анализе первичной структуры таких макромолекул они часто представляются в виде двухбуквенных последовательностей путем соответствующей перекодировки. В случае белков все аминокислотные остатки разбиваются ■к на две группы - гидрофобные и гидрофильные, и белковая макромолекула представляется как сополимер из двух сортов мономерных звеньев. Такое представление позволяет выявить основные закономерности в чередовании групп данного сорта и сделать выводы о возможной пространственной структуре биополимера и функциях закодированных в его последовательности, что, несомненно, важно как для понимания процессов жизнедеятельности клетки, так и для возможного воспроизведения этих механизмов в искусственных полимерных системах.

Целью данной диссертационной работы был поиск оптимальных процедур, позволяющих эффективно анализировать сложные последовательности и путем варьирования архитектуры и последовательности конструировать полимерные материалы с заданным масштабом микронеоднородностей, стабильных в широком интервале физических параметров системы.

На защиту выносятся следующие основные положения диссертационной работы:

1. Предложена эффективная методика сегментации и идентификации двухбуквенных ЛВ последовательностей с различной статистикой распределения звеньев А и В. Показано, что сегментационная функция случайной последовательности является константой, зависящей от состава; сегментационная функция блочного сополимера является осциллирующей функцией, а период осцилляций определяется средней длиной блока; сегментационная функция белковоподобного сополимера при малых к растет, а затем выходит на плато максимальные значения которой ложатся на прямую, зависящую от состава сополимера.

2. Белковые последовательности могут быть представлены как тексты, написанные на «белковом» языке. В них можно выделять повторяющиеся мотивы («слова») различных длин. Максимальные длины слов» различны для белков различных классов (глобулярные, мембранные и фибриллярные белки).

3. Характерный период структуры, возникающей при микрофазном расслоении в расплаве диблоксополимеров, состоящих из гребнеобразного и линейного блоков, сильно несовместимых между собой, в широкой области изменения параметров системы определяется параметрами гребнеобразного блока и практически не зависит от геометрических параметров линейного блока. При этом гребнеобразный блок достаточно сильно вытянут (степень его растяжения тем больше, чем выше плотность пришивки и длина боковых цепей), что приводит к возникновению режима сверхсильной сегрегации, когда период структуры линейно зависит от длины остова гребнеобразного блока.

4. Предложен дизайн полимерных материалов, с заданным масштабом микронеоднородностей, стабильных в заданном интервале температур. В ходе эволюционной процедуры, обнаружена полимерная система, масштаб микронеоднородностей которой превышает масштаб микронеоднородностей расплава диблоксополимеров.

Научная новизна работы определяется прежде всего тем, что большинство рассмотренных задач исследовались впервые. В результате изучения этих задач было предсказано существование ряда новых эффектов, некоторые из которых уже обнаружены экспериментально. Методы анализа первичной структуры биологических и модельных последовательностей, предложенные в данной диссертационной работе, нигде ранее не использовались и поэтому позволяют взглянуть на свойства биологических последовательностей с принципиально новой точки зрения.

Практическая ценность работы обусловлена тем, что полученные результаты найдут применение в самых различных областях науки. В нанотехнологии для создания материалов с заданной микроструктурой. В биоинформатике - в качестве новых методов сегментации и идентификации биологических последовательностей.

Структура и объем работы. Диссертация состоит из введения, пяти глав, выводов и списка цитируемой литературы из 87 наименований. Диссертация содержит 108 страниц, включая рисунки, оглавление и список литературы.

 
Заключение диссертации по теме "Высокомолекулярные соединения"

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ ДИССЕРТАЦИИ

1. Предложен и апробирован метод сегментации и идентификации бинарных последовательностей АВ сополимеров с различной статистикой распределения звеньев, основанный на расчете введенной нами впервые сегментационной функции и функции дивергенции Йенсона-Шеннона, вычисленной для энтропии Шеннона по отношению к вероятности встречи блока А или В длины п.

2. Разработана методика анализа белковых последовательностей как текста, написанного на «белковом» языке. Методика апробирована на англоязычных текстовых последовательностях. Показано, что в последовательностях белков действительно можно выделять повторяющиеся мотивы («слова») различных длин, и что максимальные длины «слов» различны для белковых последовательностей различных классов.

3. Построена теория микрофазного расслоения в расплаве диблоксополимера, состоящего из гребнеобразного и линейного блоков, сильно несовместимых между собой. Показано, что в широкой области изменения параметров макромолекулы характерный период структуры определяется параметрами гребнеобразного блока и практически не зависит от геометрических параметров линейного блока. При этом гребнеобразный блок достаточно сильно вытянут (степень его растяжения тем больше, чем выше плотность пришивки и длина боковых цепей). Показано, что в таких системах может возникнуть режим сверхсильной сегрегации вследствие предельной вытяжки гребнеобразного блока.

4. Предложена методика быстрого конструирования первичных последовательностей сополимеров, образующих в расплавах структуры с заданным масштабом микронеоднородностей и стабильных в заданном температурном интервале. Показано, что диблоксополимеры и слабо дефектные диблоксополимеры претерпевают переход в микрофазное состояние при более высоких температурах, чем сополимеры с другими распределениями звеньев. Показано, что при фиксированном составе сополимера максимальный масштаб микронеоднородностей наблюдается в системе, формируемой слабо дефектными диблоксополимерами, в которых блоки содержат небольшую фракцию звеньев другого сорта.

Пользуясь возможностью, хотелось бы выразить глубокую благодарность Василевской Валентине Владимировне и Хохлову Алексею Ремовичу за чуткое и доброжелательное руководство, за предложенную интересную тему исследований.

Автор признателен и благодарен Халатуру Павлу Геннадиевичу и Макееву Всеволоду Юльевичу за помощь и многочисленные консультации во время выполнения работы.

Особую благодарность хотелось бы выразить сотрудникам лаборатории физической химии полимеров Института элементоорганических соединений РАН и кафедры физики полимеров и кристаллов физического факультета МГУ им. М.В.Ломоносова за создание обстановки благоприятствующей выполнению данной диссертационной работы.

 
Список источников диссертации и автореферата по химии, кандидата физико-математических наук, Гусев, Леонид Владимирович, Москва

1. Leibler, Theory of Microphase Separation in Block Copolymer, Macromolecules, 1980, 13, 1602

2. I.Ya. Erukhimovich, Fluctuations and Formation of Domain Structure in Heteropolymers, Vysokomol Soyed., 1982, 9, 1942-1949

3. P.-G de Gennes, Scaling Concepts in Polymer Physics, Cornell Univ. Press, 1979

4. S. Kuchanov (ed.), Mathematical methods in contemporary chemistry, Gordon & Breach, 1996

5. A.N. Semenov, Contribution to the theory of microphase layering in bockcopolymer melts, Sov. Phys. JETP, 1985, 61, 733

6. L.A. Nyrkova, A.R. Khokhlov, M. Doi, Microdomains in Block-Copolymers and Multiplets in Ionomers: Parallels in Behavior, Macromolecules, 1993, 26, 3601

7. F.S. Bates and G.H. Fredrickson, Block copolymer thermodynamics: Theory and experiment, Annu. Rev. Phys. Chem., 1990,41, 525-557

8. G.H. Fredrickson and F.S. Bates, Dynamics of block copolymers: Theory and Experiment, Annu. Rev. Mater. Sci., 1996, 26, 501-550

9. T.M. Birshtein, O.V. Borisov, E.B Zhulina, A.R. Khokhlov, T.A. Yurasova, Conformations of a Comb-like Macromolecule, Vysokomolekul. Soed., 1987, 29 A, 1169

10. J. Ruokolainen, R.Makinen, M. Torkkeli, T. Makela, R. Serimaa, G. ten Brinke, O. Ikkala, Switching Supramolecular Polymeric Materials with Multible Length Scales, Science, 1998, 280, 557

11. P.J. Flory, Principles of Polymer Chemistry, Cornell Univ. Press, Ithaca, NY, 1953

12. A.V. Dobrynin, I.Ya. Erukhimovich, Computer-aided comparative investigation of architecture influence on block copolymer phase diagrams, Macromolecules, 1993, 26, 276

13. I.W. Hamley, The Physics of Block Copolymers, Oxford University Press: Oxford, New York, Tokio, 1998

14. T. Goldacker, V. Abetz, R. Stadler, I.Ya. Erukhimovich, L. Leibler, Non-centrosymmetric superlattices in block copolymer blends, Nature, 1999, 398, 137

15. S.T. Milner, Chain Architecture and Asymmetry in Copolymer Microphases, Macromolecules, 1994, 27, 2333

16. J. Ruokolainen, J. Tanner, O. Ikkala, G. ten Brinke, E.L. Thomas, Direct Imaging of Self-Organized Comb Copolymer-like Systems Obtained by Hydrogen Bonding: Poly(4-vinylpyridine)-4-Nonadecylphenol,

17. Macromolecules, 1998, 31, 3532

18. J.Ruokolainen, G. ten Brinke, O. Ikkala, Supramolecular Polymeric Materials with Hierarchical Structure-Within-Structure Morphologies, Adv. Mater., 1999, 11,777

19. G. ten Brinke and O. Ikkala, Functional polymeric materials: complexing amphiphiles as structure-inducing elements, Macromol. Symp., 2003, 203, 103109

20. A.R. Khokhlov, P.G. Khalatur, Protein-like copolymers: computer simulation, Physica A, 1998,249, 253

21. V.A. Ivanov, A.V. Chertovich, A.A. Lazutin, N.P. Shusharina, P.G. Khalatur, A.R. Khokhlov, Computer Simulation of Globules with Microstructure, Macromol. Symposia, 1999, 146, 259

22. A.R. Khokhlov, P.G. Khalatur, Conformation-Dependent Sequence Design (Engineering) of A B Copolymers, Physical Review Letters, 1999, 82, 3456

23. E.A. Zheligovskaya, P.G. Khalatur, A.R. Khokhlov, Properties of AB Copolymers with a Special Adsorption-Tuned Primary Structure, Physical Review E, 1999,59,3071

24. J. Virtanen, H. Tenhu, Grafting of Poly(N-isopropylacrylamide) with Poly(ethylene oxide) under Various Reaction Conditions, Macromolecules, 2000,33,336

25. V.I. Lozinsky, I.A. Simenel, E.A. Kurskaya, V.K. Kulakova, V.Ya. Grinberg, A.S. Dubovik, I.Yu. Galaev, B. Mattiasson, A.R. Khokhlov, Synthesis of N-vinylcaprolactam polymers in water-containing media, Rep. Russ. Acad. Sci., 2000, 375, 637

26. P.-0. Wahlund, I.Yu. Galaev, S.A. Kazakov, V.I. Lozinsky, B. Mattiasson, Protein-Like Copolymers: Effect of Polymer Architecture on the Performance in Bioseparation Process, Macromol. Biosci., 2002, 2, 33

27. C.-K. Peng, S.V. Buldyrev, A.L. Goldberger, S. Havlin, F. Sciortino, M. Simons, and H.E. Stanley, Long-range correlations in nucleotide sequences, Nature, 1992, 356, 168

28. A.V. Chertovich, V.A. Ivanov, A.A. Lazutin, A.R. Khokhlov, Sequence design of biomimetic copolymers: modeling of membrane proteins and globular proteins with active enzymatic center, Macromol. Symp., 2000, 160, 41

29. N.Yu. Starovoitova, A.V. Berezkin, Yu. A. Kriksin, O.V. Gallyamova, P.G. Khalatur, A.R. Khokhlov, Modeling of radical copolymerization near a selectively adsorbing surface: Design of gradient copolymers with long-range correlations, (in press)

30. A.V. Berezkin, M.A. Solov'ev, P.G. Khalatur, A.R. Khokhlov, Template copolymerization near a patterned surface: Computer simulation, J. Chem. Phys.,2004, 121, 12, 6011-6020

31. Н.Ю. Старовойтова, П.Г. Халатур, А.Р. Хохлов, Сополимеризация вблизи адсорбирующей поверхности: компьютерное моделирование, Доклады академии наук, 2003, 392, 5, 641-644

32. Ю.А. Криксин, П.Г. Халатур, А.Р. Хохлов, Модель адсорбции сополимера на поверхности с активными центрами, (в печати)

33. A. Naidenov, S. Nechaev, Adsorption of a random heteropolymer at a potential well revisited: location of transition point and design of sequences, J. of Physics A: Mathematical and General, 2001, 34, 5625-5634

34. M. Muthukumar, Pattern recognition by polyelectrolytes, J. of Chemical Physics, 1995, 103, 11,4723-4731

35. A.K. Chakraborty, A simple theory and Monte Carlo simulations for recognition between random heteropolymers and disordered surfaces, J. of Chemical Physics, 1998, 108, 4,1676-1682

36. J. Genzer, Copolymer adsorption on planar substrates with a random distribution of chemical heterogeneities, J. of Chemical Physics, 2001, 115, 10, 4873-4882

37. J. Genzer, Copolymer-assisted generation of three-dimensional patterns by replicating two-dimensional substrate motifs, Physical Review E, 2001, 63, 022601, 1-4

38. A.J. Golumbfskie, S.P. Vijay, A.K. Chakraborty, Simulation of biomimetic recognition between polymers and surfaces, PNAS, 1999, 96, 21, 11707-11712

39. E.N. Govorun, V.A. Ivanov, A.R. Khokhlov, P.G. Khalatur, A.L. Borovinsky, A.Yu. Grosberg, Primary Sequences of Proteinlike Copolymers: Levy-Flight-Type Long-Range Correlations, Physical Review E, 2001, 64, 040903

40. S. I. Kuchanov and A. R. Khokhlov, Copolymers with Designed Protein-Like Sequence Obtained by Polymer analogous Transformations of Homopolymer Globule, J. Chem. Phys., 2003, 118, 10, 4684-4691

41. И.М. Лифшиц, Некоторые вопросы статистической теории биополимеров, ЖЭТФ, 1968, 55, 2408

42. N. Sueoka, On the Genetic Basis of Variation and Heterogeneity of DNA Base Composition, Proc. Nat. Ac. Sc., 1962, 48, 582-592

43. R.A Elton, Theoretical models for heterogeneity of base composition in DNA, J. Theor. Biol., 1974, 45, 533-553

44. O.W.J. Ewens, G.R. Grant, Statistical Methods in Bioinformatics, Springier — Verlag, New York, 2002

45. P.A. Pevzner, Computational Molecular Biology: An Algorithmic approach, MIT Press, Cambridge, 2000

46. SV Buldyrev, AL Goldberger, S Havlin, CK Peng, M Simon, F Sciortino, HE Stanley, Long-range fractal correlations in DNA (comments), Physical Review Letters, 1993,71, 11, 1776

47. W. Li, K. Kaneko, Long-range correlation and partial 1/fa spectrum in a noncodingDNA sequence, Europhysics Letters, 1992, 17, 7, 655-660

48. S.M. Ossadnik, S.V. Buldyrev, A.L. Goldberger, S. Havlin, R.N. Mantegna, C.K. Peng, M. Simons and H.E. Stanley, Correlation approach to identify coding regions in DNA sequences, Biophys. J., 1994, 67, 64

49. C.-K. Peng, S.V. Buldyrev, A.L. Goldberger, S. Havlin, F. Sciortino, M. Simons, H.E. Stanley, Long-range correlation properties of coding and noncoding DNA sequences: GenBank analysis, Physical Review E, 1995, 51, 5, 5084

50. R. N. Mantegna, S. V. Buldyrev, A. L. Goldberger, S. Havlin, C.-K. Peng, M. Simons, and H. E. Stanley, Systematic Analysis of Coding and Noncoding DNA Sequences Using Methods of Statistical Linguistics, Physical Review E, 1995, 52, 3 2939

51. G.M. Viswanathan, S. V. Buldyrev, S. Havlin, and H.E. Stanley, Quantification of DNA patchiness using long-range correlation measures, Biophys J., 1997, 72, 866

52. R.F. Voss, Evolution of long-range fractal correlations and 1/f noise in DNA base sequences, Physical Review Letters, 1992, 68, 3805

53. R.F. Voss, Long-range fractal correlations in DNA introns and exons, Fractals, 1994,2,1,1-6

54. H. Herzel, I. Große, Correlations in DNA sequences the role of protein coding segments, Physical Review E, 1997, 55, 1, 800-810

55. C.-K. Peng, S.V. Buldyrev, A.L. Goldberger, S. Havlin, F. Sciortino, M. Simons, H.E. Stanley, Species independence of mutual information in coding and noncodingDNA, Physical Review E, 2000, 61, 5, 5624

56. Z.G. Yu, V. Anh, K.S. Lau, Multifractal characterisation of length sequences of coding and noncoding segments in a complete genome, Physica A, 2001, 301,351-36163 .A.A. Borovkov, Mathematical Statistics, Mir, Moscow, 1984

57. M.L. Mene'ndez, J.A. Pardo, L. Pardo, and M.C. Pardo, The Jensen-Shannon Divergence, J.Franklin Inst., 1997, 334B, 307

58. P. Bernaola-Galvan, R. Roman-Roldan, J.L. Oliver, Compositional segmentation and long-range fractal correlations in DNA sequences, Physical Review E, 1996, 53,5,5181-5189

59. W. Li, The complexity of DNA: the measure of compositional heterogeneity in DNA sequences and measures of complexity, Complexity, 1997, 3, 2, 33-37

60. R. Roman-Roldan, P. Bernaola-Galvan, J.L. Oliver, Sequence compositional complexity of DNA through an entropic segmentation method, Physical Review Letters, 1998, 80, 4, 1344-1347

61. P. Bernaola-Galvan, J.L. Oliver, R. Roman-Roldan, Decomposition of DNA sequence complexity, Physical Review Letters, 1999, 83, 16, 3336-3339

62. J.L. Oliver, R. Roman-Roldan, J. Perez, P. Bernaola-Galvan, SEGMENT: identifying compositional domains in DNA sequences, Bioinformatics, 1999, 15, 12, 974-979

63. P. Bernaola-Galvan, I. Grosse, P. Carpena, J.L Oliver, R. Romän-Roldän, H.E. Stanley, Finding borders between coding and non-coding regions by an entropic segmentation method, Physical Review Letters, 2000, 85, 6, 13421345

64. Gross, P. Bernaola-Galvan, P. Carpena, R. Roman-Roldan, J.L. Oliver, H.E. Stanley, Analysis of symbolic sequences using the Jense-Shannon divergence, Physical Review E, 2002, 65, 041905

65. P.G. Khalatur, V.V. Novikov, A.R. Khokhlov, Conformation-Dependent Evolution of Copolymer Sequences, Physical Review E, 2003, 67, 051901

66. W. Li, The complexity of DNA: the measure of compositional heterogeneity in DNA sequences and measures of complexity, Complexity, 1997, 3,2, 33-37

67. R. Dubin, S. Eddy, A. Krogh, G. Mitchinson, Biological sequence analysis. Probabilistic models of proteins and nucleic acids, Cambridge, Cambridge University Press, 2001

68. A.H. Горбань, Т.Г. Попова, М.Г. Садовский, Классификация нуклеотидных последовательностей по частотным словарямобнаруживает связь между их структурой и таксономическим положением организмов, Журн. общ. биологии, 2003, 64, 1, 51-63

69. Н. Bussemaker, Н. Li, Е. Siggia, Building a dictionary for genomes: Identification of presumptive regulatory sites by statistical analysis, Proceedings of the National Academy of Sciences, 2000, 97, 10096

70. H.J. Bussemaker, H. Li, and E.D. Siggia, Building a dictionary for genomes: Identification of presumptive regulatory sites by statistical analysis, PNAS, 2000, 97, 18, 10096-10100

71. N. Dokholyan, S.V. Buldyrev, S. Havlin, and H.E. Stanley, Model of unequal chromosomal crossing over in DNA sequences, Physica A, 1998, 249, 594-599

72. S.V. Buldyrev, N.V. Dokholyan, S. Havlin, H.E. Stanley, and R.H.R. Stanley, Expansion of Tandem Repeats and Oligomer Clustering in Coding and NoncodingDNA Sequences, Physica A, 1999, 273, 19-32

73. D.L. Nelson, M.M. Cox, Lehninger Principles of Biochemistry, Worth Publishers, NewYork, 2000

74. Б. Вейр, Анализ генетических данных: Дискретные генетические признаки, (Пер. с англ.), Москва, Мир, 1995, 400; B.S. Weir, Genetic data analysis. Methods for discrete population genetic data, Massachusetts, Sinauer Associates, 1990

75. A.B. Финкелынтейн, О.Б. Птицын, Физика белка. Курс лекций, Книжный Дом Университет, Москва, 2002

76. Z.G. Yu, V. Anh, K.S. Lau, Multifractal and correlation analyses of protein sequences from complete genomes, Physical Review E, 2003, 68,2, 021913

77. L.V.Gusev, V.V. Vasilevskaya, V.Ju. Makeev, P.G. Khalatur and A. R. Khokhlov, Segmentation Of Heteropolymer Sequences Specifying Subsequences With Different Composition And Statistical Properties, Macromol. Theory Simul., 2003, 12,604-613

78. В.В. Василевская, Л.В. Гусев, А.Р. Хохлов, Белковые последовательности как «литературный» текст", Доклады академии наук. Биохимия, Биофизика, Молекулярная Биология, 2004, 397, 235-238