Жидкостная хроматография в критических условиях в сочетании с масс-спектрометрией для изучения первичной структуры биомолекул тема автореферата и диссертации по физике, 01.04.17 ВАК РФ

Тарасова, Ирина Алексеевна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2007 ГОД ЗАЩИТЫ
   
01.04.17 КОД ВАК РФ
Диссертация по физике на тему «Жидкостная хроматография в критических условиях в сочетании с масс-спектрометрией для изучения первичной структуры биомолекул»
 
Автореферат диссертации на тему "Жидкостная хроматография в критических условиях в сочетании с масс-спектрометрией для изучения первичной структуры биомолекул"

На правах рукописи УДК 541 64 543 544

ТАРАСОВА ИРИНА АЛЕКСЕЕВНА

Жидкостная хроматография в критических условиях в сочетании с масс-спектрометрией для изучения первичной структуры биомолекул

01 04 17 - химическая физика, в том числе физика горения и взрыва

автореферат диссертации на соискание ученой степени кандидата физико-математических наук

□ОЗОВБЗ14

Москва - 2007

003065314

Работа выполнена в Институте энергетических проблем химической физики РАН на кафедре химической физики Московского физико-технического института

Ведущая организация

Московский государственный университет им М В Ломоносова, г Москва

Защита состоится «11» октября 2007 г в 10 час 00 мин на заседании диссертационного совета К 212 156 03 при Московском физико-техническом институте по адресу 141700, Московская обл , г Долгопрудный, Институтский пер 9, МФТИ

С диссертацией можно ознакомиться в библиотеке МФТИ

Автореферат разослан «_»_2007 г

Ученый секретарь диссертационного совета

Научный руководитель

кандидат физико-математических наук, кандидат технических наук Горшков Михаил Владимирович

Официальные оппоненты

доктор физико-математических наук, профессор Барашев Петр Петрович кандидат физико-математических наук Франкевич Владимир Евгеньевич

кандидат физико-математических наук

В Е Брагин

Общая характеристика работы

Введение. Актуальность проблемы В настоящее время задача определения первичной структуры белка, т е его аминокислотной последовательности, решается преимущественно методами тандемной масс-спектрометрии (МС/МС) В первую очередь это связано с тем, что масс-спектрометрический метод секвенирования белков является самым быстрым из всех известных В протеомных исследованиях для осуществления МС/МС секвенирования распространение получили масс-анализаторы типа квадрупольной радиочастотной ловушки, времяпролетные масс-спектрометры, спектрометры ионного циклотронного резонанса, а также совсем новый тип масс-анализатора, получивший название "орбитальная ионная ловушка" (orbitrap) Масс-спектрометрия добилась несомненных успехов в области исследования и идентификации структуры белков и пептидов, а также в решении других задач протеомики и биоинформатики В то же время, многие исследователи отмечают высокий процент ложных идентификаций пептидов, а, следовательно, и белков, если определение их аминокислотной последовательности проводится исключительно по масс-спектрометрическим данным В связи с этим, существует необходимость развития новых, независимых от масс-спектрометрии, методов определения и идентификации аминокислотных последовательностей Естественным представляется использование для этих целей высокоэффективной жидкостной хроматографии (ВЭЖХ) Во-первых, перечисленные выше типы масс-спектрометров работают "в связке" с хроматографом, позволяющим разделить сложные смеси пептидов, образующихся в результате ферментативного гидролиза белков, и, тем самым, упростить их МС/МС анализ Во-вторых, разделение в хроматографии основано на взаимодействии макромолекулы с поверхностью, и это взаимодействие также отражает характер чередования аминокислотных остатков в цепи Однако до последнего времени хроматографические данные, объем или время удерживания, получаемые в ходе разделения, мало использовались или не использовались вообще для определения аминокислотной последовательности пептидов Несмотря на возросший в последнее время интерес к хроматографии как к источнику дополнительной информации о первичной структуре пептидов и белков, не было предложено содержательной физической теории, описывающей процессы разделения биомакромолекул и позволяющей связать закономерности разделения с "текстом" аминокислотной последовательности Существующие методы предсказания удерживания пептидов с известной

последовательностью строились либо на основе моделей, развитых для низкомолекулярных соединений, либо на основе систем искусственного интелчекта Это в лучшем случае позволяло "определить" средний аминокислотный состав пептида, но не характер чередования аминокислотных остатков в цепи

Цель и задачи исследования Основной целью и задачами работы были (1) разработка модели хроматографического разделения биомакромолекул (BioLCCC), учитывающей зависимость их хроматографического удерживания от первичной структуры -последовательности аминокислотных остатков, (2) экспериментальная верификация предложенной модели для предсказания времени и порядка выхода биомакромолекул с разными "текстами" в условиях градиентной хроматографии, (3) интеграция данных по последовательности цепи, получаемых в рамках развитого хроматографического подхода, с существующими экспертными системами МС/МС секвенирования для повышения достоверности идентификации белков и пептидов

Научная новизна

1 Впервые предложена физическая модель, описывающая взаимодействие связанных в цепь аминокислотных остатков биомакромолекулы с поверхностью, и учитывающая зависимость взаимодействия (статистической суммы) от их последовательности в цепи

2 Впервые концепция жидкостной хроматографии в критических условиях, развитая для исследования строения цепи синтетических полимеров, применена для описания разделения биомакромолекул в ВЭЖХ, в том числе и в условиях градиентной хроматографии

3 Впервые экспериментально найдены эффективные энергии адсорбции 20 наиболее распространенных в природе аминокислотных остатков, а также концевых групп пептидов, с гидрофобной поверхностью типа Cis

4 Впервые модель хроматографического разделения пептидов применена, в том числе совместно с экспертными системами МС/МС секвенирования, для определения последовательностей пептидов, для идентификации модифицированных участков аминокислотных последовательностей, вызванных либо пострансляционными модификациями белков, мутациями в процессе их синтеза, либо перестановками аминокислотных остатков

Практическое значение работы. Полученные результаты могут быть использованы исследователями, работающими в области протеомики, для решения следующих проблем

- предсказания времен удерживания биомакромолекул с известной последовательностью, что позволит повысить достоверность идентификации пептидов и белков, полученных в результате хромато-масс-спектрометрического анализа,

- определения аминокислотных последовательностей неизвестных или отсутствующих в протеомных базах данных белков (de novo sequencing),

- определения или идентификации типа и места посттрансляционных модификаций в аминокислотной последовательности, а также изомерных аминокислот

Личный вклад автора Материал, представленный в диссертации получен при непосредственном участии автора в постановке задач исследований, в выполнении экспериментов и в обсуждении полученных результатов Диссертационная работа выполнена на кафедре химической физики Московского физико-технического института в лаборатории физических основ и техники масс-спектрометрии биополимеров Института энергетических проблем химической физики РАН в период с 2004 по 2007 год

Апробация работы Результаты работы докладывались и обсуждались на следующих российских и международных конференциях 2-й Съезд Всероссийского масс-спектрометрического общества "Масс-спектрометрия и ее прикладные проблемы", 2005, Москва, Россия, 53-я Конференция Американского масс-спектрометрического общества,

2005, Сан Антонио, США, 17-я Международная масс-спектрометрическая конференция,

2006, Прага, Чехия, XLIX Научная конференция Московского физико-технического института, 2006, Москва, Россия, 54-я Конференция Американского масс-спектрометрического общества, 2006, Сиэтл, США, 3-я Школа-семинар "Масс-спектрометрия в химической физике, биофизике и экологии", 2007, Звенигород, Россия

Публикации. Основное содержание диссертационной работы опубликовано в статьях, список которых приведен в конце автореферата Работы, вошедшие в диссертацию, были выполнены при поддержке РФФИ (гранты №№ 03-04-48228, 06-04-49632), Российской Академии Наук (ОХНМ 4 2), CRDF (гранты №№ RUC1-5031-MO-04, RUE1-O00588-M0-05), и INTAS (Young Scientist Fellowship №¡04-83-2643 и Genomics-05-1000004-7759)

Объём и структура диссертации. Работа изложена на 94 страницах, иллюстрирована 26-ю рисунками и содержит 2 таблицы Диссертация состоит из Введения, четырех глав, включая литературный обзор, и основных результатов и выводов Список цитированной литературы содержит 72 наименования

Содержание работы.

Глава 1 содержит обзор литературы, в котором рассмотрены вопросы применения масс-спектрометрии для исследования биомолекул, современные методы жидкостной хроматографии макромолекул, модели предсказания хроматографических времен удерживания белков и пептидов по их аминокислотным последовательностям, а также методы биоинформатики для решения задач идентификации белков и пептидов по масс-спекгрометрическим данным

Основное внимание в обзоре уделено проблемам, возникающим при масс-спектрометрическом анализе сложных пептидных смесей, секвенировании и идентификации пептидов и белков Для секвенирования пептидов используется их направленная фрагментация (преимущественно по пептидной связи) методами столкновительной диссоциации или захвата медленных электронов Получающийся при этом спектр фрагментов характеризуется тем, что разность между соседними по массам пиками различается на массу соответствующего аминокислотного остатка Тем самым, разбивая макромолекулярный ион на фрагменты, оказывается возможным восстановить полностью или, по крайней мере, частично аминокислотную последовательность пептида Однако на пути экспериментальной реализации такого подхода существуют проблемы Во-первых, некоторые из аминокислотных остатков имеют близкие (Lys и Gin, здесь и далее используются стандартные обозначения аминокислотных остатков) или тождественные (Leu и Ile) массы, так что последовательность определяется «с точностью» до замены остатков с одинаковой или близкой массой Во вторых, в большинстве случаев экспериментально не удается получить полный спектр фрагментации Это обуславливает необходимость вовлечения в протеомные исследования других методов, дающих дополнительную к масс-спектрометрии информацию о последовательности

Таким методом, безусловно, является жидкостная хроматография, и в последнее время делались попытки вовлечения хроматографических данных, совместно с MC, в решение задачи определения последовательности Очевидно, что для использования хроматографии как дополнительного источника данных, необходимо найти связь между последовательностью и временем удерживания Для установления такой связи с начала 80-тых годов использовались традиционные для хроматографии низкомолекулярных веществ эмпирические подходы Их экстраполяция на биомакромолекулы сводилась к суммированию «коэффициентов удерживания», относящихся к каждому из аминокислотных остатков и

определяемых экспериментально Очевидно, это не позволяет «увидеть» аминокислотную последовательность, т к перестановки различных остатков, удаленных по цепи, в рамках такого теоретического подхода приводят к предсказаниям одинакового времени удерживания В то же время, экспериментально было обнаружено, что удерживание пептидов, имеющих один и то же набор аминокислот, может заметно различаться Для учета этого в эмпирические теории необходимо вводить поправки, учитывающие «соседей» по цепи, их зарядовое состояние, и т п В целом, количество поправочных коэффициентов может превышать несколько сотен Самое главное, что эмпирический подход, хотя и дополненный зачастую правильными качественными соображениями, не позволяет понять в целом физическую сущность зависимости разделения от последовательности цепи

Очевидно, что зависимость взаимодействия пептида с поверхностью от последовательности обусловлена связанностью аминокислотных остатков в цепь, с коллективным характером этого взаимодействия с поверхностью Такие же проблемы имеют место и в хроматографии синтетических полимеров Для определения строения макромолекул синтетических полимеров в хроматографии применяется подход, совершенно отличный от экстраполяции подходов, развитых для низкомолекулярных веществ В основу теории, связывающей удерживание со структурой цепи, положена решеточная модель цепи Оказывается, что такая простейшая модель правильно описывает основные закономерности разделения макромолекул, в том числе содержащих «модифицированные» мономеры При этом наиболее чувствительным к строению цепи оказывается режим разделения вблизи критической точки адсорбции, где существует тонкий баланс между потерями энтропии цепи и приобретением энергии за счет притяжения к поверхности любое малое отличие в строении цепи нарушает этот баланс и наиболее отчетливо проявляется в этом режиме Критическая хроматография практически решила проблему определения строения цепи макромолекул, в тч и определения таких тонких параметров, как характер чередования разных мономеров в цепи, место и тип функциональных групп или модификаторов, т е задач, идейно весьма близких к тем, которые возникают при хроматографическом анализе последовательностей пептидов и белков Несмотря на то, что модель разделения, используемая в критической хроматографии, допускает обобщение и для биомакромолекул, она никогда не использовалась для установления связи между удерживанием и последовательностью пептидов Обсуждается возможность применения основных идей критической хроматографии для описания разделения пептидов и белков, возможность предсказания времен удерживания по известным аминокислотным последовательностям, а

также возможность решенйя «обратной задачи» - определения последовательности или каких-то ее элементов из хроматографических данных Тем самым, формулируются основные задачи исследования

Глава 2 содержит теоретическое описание модели жидкостной хроматографии в критических условиях в применении к биополимерам (ВюЬССС) Рассматриваются основные предположения, которые легли в основу модели ВшЬССС, а также степень идеализации, позволяющая записать основные уравнения в наиболее простой форме, допускающей в некоторых случаях аналитическое решение для предсказания времен удерживания

Модель случайных блужданий для гетерополимеров В силу сложности рассматриваемой системы, описание взаимодействия реальной макромолекулы с поверхностью, учитывающее детальное химическое строение, как самой макромолекулы, так и поверхности, и молекул растворителя, как методами квантовой химии, так и другими методами математического моделирования, вряд ли возможно в обозримом будущем Это связано не только с ограничениями в вычислительной мощности, но также и с тем, что реальные потенциалы взаимодействий известны лишь приблизительно, так что сложные и длительные расчеты также будут далеки от реальности Однако, в хроматографической системе существуют соотношения между рядом параметров

Размер колонки Ь » размер частиц <1 » размер пор Б ~ размер макромолекул Я » размер мономеров а, мопекул растворителя г, адсорбционных потенциалов, го которые позволяют значительно упростить модель разделения В частности, из того факта, что размер макромолекул больше размера мономеров и радиусов взаимодействия, можно на первом этапе пренебречь особенностями химической структуры мономеров, а также использовать самые простые представления о характере взаимодействия мономеров с поверхностью На практике для описания поведения макромолекулы при взаимодействии с поверхностью адсорбента удобной оказывается модель случайных блужданий по узлам кубической решетки (рМато Е А , ЯиЫп Я / 1971) В этой модели (рис 1), макромолекула

(в нашем случае биомакромолекула) представляется линейной цепочкой «бестелесных»

Рис 1 Модель случайных блужданий цепи по узлам кубической решетки

мономеров (аминокислотных остатков), соединенных между собой наподобие шариков на шарнирах Пора адсорбента моделируется щелью, размер которой определяется отношением размера поры к размеру мономера, и, как правило, не превышает 30 При этом взаимодействие макромолекулы с поверхностью определяется теми мономерами, которые находятся непосредственно в контакте с поверхностью (слой 1 и Б, рис 1) Мономеры макромолекулы, оставаясь связанными в цепь, случайным образом могут «перемещаться» по узлам кубической решетки в поре, образуя, тем самым, все возможные состояния Для определения статистической суммы достаточно просуммировать по всем возможным конфигурациям с учетом их статистического веса, зависящего от того, какие мономеры находятся на поверхности и взаимодействуют с ней Контакт (-того мономера с поверхностью

увеличивает статистический вес конфигурации на величину ехр£с-^, где , - эффективная энергия адсорбции Таким образом, различие в химическом строении аминокислотных

остатков сводится к различию их эффективных энергий адсорбции, которые следует рассматривать как феноменологические параметры модели

Чтобы по считать статистическую сумму макромолекулы в поре, 2Р, и определить основную количественную характеристику в хроматографии - коэффициент распределения, К^, проще всего воспользоваться методом переходной матрицы, элементы которой есть условная вероятность перехода мономера из одного узла в соседний

2/ /3 /6 е 0 0 0

К ч Уб 0 0

0 Ув 2/ /3 1/ /6 0

(1)

Уб

Если аминокислотная последовательность состоит из N мономеров, то произведение стартового вектора Ро=\ exp(ie^,) J 1 ехр{ее^ ,)\т, описывающего распределение начального аминокислотного остатка (С -конца для определенности), на N-J матриц перехода, дает распределение N- конца внутри поры, а суммирование по всем координатам N-конца цепи определяет статистическую сумму цепи в поре и, соответственно, коэффициент распределения

Kt=±Z,-\II 1 1 \\f[W(J*,)P9 (2)

L) U „2

При этом следует отметить важное свойство, вытекающее из такой записи коэффициента распределения Поскольку каждая матрица перехода описывает конкретную

е/Г

аминокислоту через энергию взаимодеиствия с поверхностью, ем,, а произведение матриц некоммутативно, то в таком представлении коэффициент распределения зависит не только от аминокислотного состава пептида, но и от порядка чередования аминокислот в цепи Кd (SEQUENCE) * Кd (SEQEUNCE)

При этом необходимо отметить, что в представлении (2) отсутствует какое-либо дополнительное взаимодействие между соседними мономерами (за исключением химической

связи) Таким образом, самого факта связывания остатков в цепь уже достаточно для того, чтобы разделение в хроматографии зависело и от последовательности Представленная модель, безусловно, не учитывает всех особенностей строения цепи реальных пептидов, в частности, возможность образования вторичных структур и т п Модель блужданий допускает рассмотрение и более реалистичных цепей, в частности, несложно ввести в эту модель параметры жесткости цепи, дополнительное взаимодействие удаленных по цепи остатков, нелокальность взаимодействия с поверхностью

Для того чтобы связать модель с реальной хроматографической системой и использовать ее для предсказания времени удерживания пептидов и их последовательности, необходимо определить ряд феноменологических параметров - эффективных энергий адсорбции, с учетом состава бинарного растворителя и изменения состава растворителя во времени в условиях градиентного элюирования

Эффективная энергия взаимодействия остатков в бинарном растворителе. Используя подход, предложенный в (LR Snyder, ¡968) для низкомолекулярных соединений, представим взаимодействие каждого аминокислотного остатка со стенкой поры, т е его эффективную энергию адсорбции ,, как разность двух взаимодействий мономер-поверхность, X",, и сольвент-поверхность, sAB(NB)

e^,=X\-eAB{NB) (3)

ЗдесьsAB(NB) - энергия десорбции растворителя (сила растворителя), которая зависит от мольной доли компонента В , N в , в бинарном растворителе АВ

Для определения зависимости eAB{NB) рассмотрим цепь блужданий на решетке в бинарном растворителе с компонентами А (вода) и В (ацетонитрил) Предположим короткодействующее взаимодействие мономера с поверхностью, ограниченное размером самого мономера а «10 А Попадание мономера на поверхность вызывает десорбцию либо молекул компонента растворителя А, либо В В силу малости средней концентрации мономеров в клубке можно предположить, что адсорбция мономеров макромолекулы слабо влияет на равновесное распределение компонентов растворителя на поверхности и в растворе Тогда усредненная матрица перехода W может быть представлена в виде W =(\-6в) W (X*-еЛ) + 6в W(X°-£B) (4)

где 0„ - степень заполнения поверхности компонентом В Легко заметить, что W есть

где

\п[(\-вв) + вв ехр(еА -£в)]

(6)

а £л и еп - соответствующие элюирующие силы "чистых" компонентов А и В Следовательно, в бинарном растворителе цепь можно представить блужданием по решетке с матрицей перехода, в которой элюирующая сила заменена на эффективную величину £лв Введем константу равновесия компонентов растворителя на поверхности

Уравнение (8) является аналогом уравнения Снайдера для элюирующей силы бинарного растворителя Таким образом, для описания закономерностей разделения при переменном во времени составе растворителя, в теорию необходимо включить еще два феноменологических параметра - элюирующие силы компонентов бинарного растворителя, которые, подобно энергии адсорбции аминокислотных остатков, имеют физический смысл эффективной энергии адсорбции компонентов растворителя

Основное уравнение градиентной хроматографии. Обычно разделение

биологических образцов происходит в условиях градиентного элюирования, т е при изменяющемся во времени составе бинарного растворителя Для завершения построения модели разделения необходимо связать объем или время удерживания с профилем градиентной программы Рассмотрим особенности критической хроматографии при изменении во времени состава растворителя Ыв = /(К) При этом также будет изменяться и коэффициент распределения где V - текущий объем растворителя,

прокачанного через колонку

При фиксированном составе растворителя средняя скорость перемещения макромолекул, имеющих время удерживания гй в колонке длиной £ равна

(?)

Тогда для элюирующей силы смеси из (6) и (7) получаем

(8)

■в

Время Л, в течение которого макромолекула будет двигаться в элементе объема с1У, очевидно, определится выражением

'к г0

где Уя - объем удерживания, а Ко - объем подвижной фазы За это время она сместится вдоль колонки на расстояние <11, равное

Условие выхода макромолекулы т колонки | Ш = Ь, откуда гУа-Г» (IV

(' — = 1 (12)

Полученное уравнение (12) позволяет определить объемы удерживания для произвольного профиля Ы„ = /(V)

Система уравнений модели ВюЬССС для определения объемов/времен удерживания пептидов. Суммируя теоретические выводы, сделанные выше, выделим четыре основных уравнения, которые описывают разделение линейных макромолекул в градиентной высокоэффективной жидкостной хроматографии ееЯ,{Ыв) = Х\-еАВ{Ыв) *АВ(П = £а+ '"С1 -Ыв(П + Nв(.У)exp(eв -еА)]

^ = -^11 1 1 1\Т[Щ**,)Р0 (13)

I) 1=2

I ГрЫ)

Система уравнений (13) позволяет последовательно рассчитать эффективную энергию взаимодействия аминокислотного остатка с поверхностью на каждом шаге градиента, ееЯ,(№„), коэффициент распределения, , и объем удерживания, Уц На практике чаще используют понятие времени удерживания, Л Г, которое пропорционально объему удерживания и зависит от скорости потока растворителя Прежде чем приступать к расчетам времен удерживания необходимо определить энергии взаимодействия всех основных аминокислот, Х°„ а также молекул растворителя с поверхностью, ел и ев

В Главе 3 описана процедура определения ряда таких феноменологических параметров как эффективные энергии адсорбции для 20 наиболее распространенных в природе аминокислот и энергии взаимодействия с поверхностью твердой фазы на основе силикагеля Cig для воды и ацетонитрила

Для описания характера разделения биомакромолекул при любых изменениях состава растворителя необходимо определить три основных феноменологических параметра энергию адсорбции аминокислотного остатка, X0, и элюирующие силы растворителей £л и ев В области, близкой к критическому режиму разделения, коэффициент распределения примерно равен 1, другими словами, сумма элементов в каждой строке матрицы перехода (1) должна быть равна 1 Отсюда имеем простейшее уравнение, связывающее феноменологические параметры модели

= (14)

Варьируя Xе', еА, ея и добиваясь наилучшего совпадения теории и эксперимента, оказывается возможным определение параметров модели, необходимых для описания с хорошей точностью перехода от эксклюзии к адсорбции Определение этих параметров дает возможность предсказывать особенности разделения макромолекул известной структуры в данном бинарном растворителе А и В при любом его составе и при любом характере изменения его состава во времени (градиенте) Применение системы уравнений (13) к описанию экспериментальных ЖХ данных, полученных в работе (Guo D, Mant С Т Taneja А К, Parker J MR, Hodges R // J Chromatogr, 1986 V 359, P 499) для синтетических пептидов типа Ac - GXXLLLKK - amid, где X - варьируемый аминокислотный остаток, позволило найти необходимую шкалу энергий Х°

Энергии Х° определялись следующим образом На первом этапе варьированием энергий Хк° ,ХС° ,XL°, добивались совпадения экспериментальных и расчетных объемов удерживания для трех основных пептидных моделей

Ac- GGGLLLKK - amid, Ac-GLLLLLKK-amid, Ac - GKKLLLKK - amid Это дало возможность найти энергии адсорбции остатков аминокислот K,G,L, содержащихся в этих трех модельных соединениях Затем, варьированием уже только одной энергии Х°, из объемов удерживания оставшихся моделей, Ас - GXXLLLKK - amid,

определялись все остальные энергии Найденная таким образом шкала энергий приведена в таблице 1 Эта шкала энергий является основой для всех последующих расчетов

Таблица 1 Энергии взаимодействия аминокислотных остатков Х°1 с поверхностью обращенной фазы -Сц (в единицах кТ)

К H S N G S Ô D Г E

0,266 0,386 0,516 0,614 0,656 0,698 0,746 0,781 0,876 0,984

А Р С Y V M I t F W

1,143 1,143 1,296 1,686 1,751 1,822 2,156 2,298 2,319 2,436

Если пептиды имеют концевые группы ( H^N -, -СООН ), то их наличие меняет энергию адсорбции концевых аминокислотных остатков XN = Х„" + , Хс - Хс" + s_C00H Использованные в (Guo D, Mant С Т Taneja А К, Parker J MR , Hodges R // J Chromatogr, 1986 V 359, P499) модели Y -GLLLLLKK - Z где Y,Z -разные типы концевых групп, позволили найти поправки к энергиям iV-концевых аминокислот £„„- = -1 69 и s^OOH =-003

В Главе 4 рассмотрено применение модели для описания разделения природных и синтетических пептидов

Экспериментальные условия и методы исследования. Эксперименты по

разделению и идентификации индивидуальных пептидов и их смесей проводились на двух системах стандартной системе ВЭЖХ НР1100 (Hewlett Packard/Agilent, США), и нано системе ВЭЖХ Agilent 1100 Стандартная система ВЭЖХ НР1100 имела в составе ультрафиолетовый детектор на основе диодной матрицы, а нано система Agilent 1100 была соединена с гибридным масс-спектрометром LTQ-FT (Thermo Fisher, Бремен, Германия) через источник ионизации «наноэлектроспрей» {Proxeon Biosystems, Оденсе, Дания) Для идентификации пептидов использовались несколько методов фрагментации ионов в результате столкновений с молекулами буферного газа (CAD) в ионной ловушке и

фрагментация в результате захвата медленных электронов (ECD) в ловушке ионного циклотронного резонанса (ИЦР) Спектры фрагментов затем использовались для восстановления последовательностей пептидов по базе данных NCBI с использованием поисковой системы Mascot (www matrixscience com')

Модельные пептиды, используемые в настоящем исследовании, были получены путем автоматизированного твердофазного синтеза на синтезаторе Intavis ResPep Synthesizer (Intavis Bioanalytical Instruments AG, Германия) Пептидный стандарт S1-S5 (Pierce Inc, USA), дайджест белка Cytochrome С (Dionex/LCPackmg, USA) и дайджест шести белков б Protein Mixture (Dionex/LCPacking, USA) являются коммерческими стандартами

Разработанная модель предсказания хроматографического удерживания биомолекул по их аминокислотной последовательности была реализована в виде программного обеспечения «Теоретический хроматограф», которое использовалось далее при обработке всех экспериментальных данных и тестировании модели BioLCCC «Теоретический хроматограф» позволяет предсказывать времена удерживания пептидов в зависимости от их первичной структуры при заданных экспериментальных условиях (1) параметры колонки (внутренний диаметр и длина колонки, размер пор, фактор, показывающий долю пространства в колонке, занятую твердой фазой), (2) профиль градиента, и, (3) состав компонентов растворителя Для расчета времен удерживания «Теоретический хроматограф» использует рад экспериментально определенных энергий адсорбции для 20 наиболее часто встречающихся природных аминокислот, а также учитывает пЬправки для различных С- и N-концевых групп

Корреляция экспериментальных и предсказанных времен удерживания на примере пептидных стандартов и дайджеста белков бактерии Escherichia Coli. Начнем обсуждение с экспериментальных результатов, полученных в ходе тестирования модели BioLCCC на коммерческих стандартах Si-Ss и дайджеста белка Cytochrome С На рис 2а и 26 представлена корреляция между экспериментальными временами удерживания и предсказанными в рамках модели BioLCCC для данных образцов Как видно, наблюдается хорошая корреляция между предсказанными и реальными временами удерживания в обоих случаях

Вместе с тем, стоит отметить, что стандарт Si явно "выпадает" из линейной зависимости на рис 2а Отличие этого стандарта от S3 заключается в том, что он имеет на конце ионизованную группу H/N- Очевидно, что эта группа сильно гидрофильна и отталкивается от поверхности (другими словами это отталкивание обусловлено тем, что

"изображение" заряда на границе раздела полярной фазы (воды) и неполярной -С|8 имеет тот же знак) Поэтому объем удерживания стандарта 5/ заметно меньше объема удерживания имеющего тот же "текст", но незаряженную концевую группу на М-конце Хотя модель ВюЬССС учитывает такое отталкивание (энергия взаимодействия группы Нз*И- принята равной £-ИгД[_ = - 1 69), однако, даже если предположить бесконечно сильное отталкивание

концевого мономера, это приводит к исключению лишь относительно небольшого числа конфигураций, а именно тех, которые начинаются на поверхности Этого, по-видимому, недостаточно для наблюдаемого уменьшения объема удерживания стандарта 5; с зарядом на конце Необходимо учитывать нелокальность взаимодействия таких концевых групп, что достаточно просто сделать в переходных матрицах уравнения (1) в рамках модели ВюЬССС Тем не менее, правильный учет взаимодействия заряженных концевых групп N11 з' , а также аминокислотных остатков лизина, аргинина и гистидина - (а также их взаимного влияния друг на друга в цепи) в рамках модели ВюЬССС пока остается открытым

(а)

(6)

65 "т

R*= 0 974 Ac-RGWGLGLGK-amldeO

60

55*

х s 2

u" sote о

4035

Ac-RGVGGLGLGK-amic

^Ac-RGAGGLGLGK- ir 1 Ac-RGGGGLGLGK-amU e

О

H,N-RGAGGLGLGK-am¡de

35 40 45 50 55 60 65 RTexp, мин

30 25

г 20 s £

¿ 15

ra

5 О

R2= 0.962

О йГ

10 15

20 25 30 RTexp, мин

35 40

Рис 2 Корреляция экспериментальных и рассчитанных по модели BioLCCC времен удерживания для коммерческого пептидного стандарта S1-SS (2а) и дайджеста белка Cytochrome С (26)

Наконец рассмотрим, возможность использования модели ШоЬССС для анализа хромэтографических данных, полученных в протеомных исследованиях смесей трнптических пептидов белков бактерии E.cqU. Глинное оглячке печного образца от двух предыдущих заключается в том, что аминокислотные последовательности для него не были известны заранее, т.е. все расчеты времен удерживания были сделаны для последовательностей, идентифицированных на осноье масс-спектрометрических данных при помощи поисковой программы Masco!. Эти последовательности были идентифицированы программой Mascot с заявленной достоверностью не менее 95% Вместе с тем следует сказать, что далеко не дли всех из этих последовательностей были получены полные спектры фрагментации высокого качества, так что достоверность их первичной структуры не абсолютная.

Как следует из рис. 3(a), ff дяя реальных систем наблюдается хорошая корреляция (коэффициент корреляции R2 - 0.9) между предсказанными и реальными временами. Тем самым, информация о возможном тексте последовательности, получаемая из времени удерживания, может быть использована для повышения достоверности идентификации пептидов, а, следовательно, и белков протеома организма.

В= = 0.906

2020 40 60 ВТ ЧОО 10 20 30 40 50 60 RTexp, мин RTexp, мин

Рис.3. Корреляция экспериментальных и рассчитанных по модели BioLCCC времен удерживания для дайджеста белков бактерии E.Coli (За) и пептидов стандартной смеси из шести белков (36)

Такой же анализ был применен и к идентифицированным последовательностям пептидов из смеси 6 белков Cytochrome С, Bovme Serum Albumin, Chicken Lysozime, Apo-transfernn, Alcohol dehydrogenase и beta-galactosidase (Dionex/LCPackings, USA) Для последнего стандарта корреляция между предсказанными и экспериментальными временами удерживания приведена на рис 3(6) В целом, степень корреляции в этом случае заметно хуже, чем для белков Е coll В отличие от белков Е coll, при анализе данной стандартной белковой смеси использовались и те идентифицированные последовательности, индекс достоверности которых был существенно ниже порогового

Предсказание разделения пептидов с модифицированными аминокислотными остатками на примере изомеров лейцин и изолейцин. Рассмотрим далее разделение биомолекул, которые содержат изомеры лейцин (L) и изолейцин (I) Интерес к хроматографическому разделению и идентификации таких макромолекул состоит в том, что такие последовательности не идентифицируются (или, по крайней мере, очень сложно идентифицируются) любыми методами МС, в том числе и по спектрам фрагментации

mAV

«I

22 RT, мин

Рис 4 Разделение пептидов, содержащих изомерные аминокислоты типа Н-КААААЬААААК-ОН (1) и Н-ЯАААА1ААААЯ-ОН (2) Расчетные в рамках модели ВюЬССС и экспериментально наблюдаемые времена удерживания соответственно 18 50 мин и 18 54 мин (1), 17 90 мин и 17 88 мин (2)

(MC/MC) Иными словами, ^ методе MC пептидные пары с одинаковым содержанием этих изомеров практически неразличимы Вместе с тем, хроматография позволяет легко разделить такие последовательности, что видно из хроматограммы, представленной на рис 4 При этом согласие предсказанного времени выхода пептидов с экспериментальным оказывается очень хорошим Этот пример подтверждает сформулированный выше тезис о комплиментарное™ хроматографических данных о последовательности, получаемых в рамках модели BioLCCC, данным MC (с точки зрения MC пептидная пара из рассмотренного примера неразличима, в то время как, с точки зрения хроматографии - это два разных «текста»)

Интересно отметить возможность разделения таких последовательностей не только по типу изомеров, но также и по месту этих изомеров в цепи Например, для последовательностей типа H-RAAAALAAAAR-OH и H-RALAAAAAAAR-OH расчетные объемы удерживания различны для условий разделения, при которых были получены данные на рис 4 Экспериментальная проверка этого факта будет служить прямым доказательством возможности использования модели BioLCCC для определения места (номера остатка) модифицированных и/или изомерных форм аминокислот в цепи, что является одной из наиболее трудных задач в протеомных исследованиях Исследование закономерностей разделения модифицированных пептидов и биомакромолекул будет предметом дальнейших экспериментальных исследований

Предсказание разделения последовательностей с перестановкой аминокислот на примере пептидов с зеркально-симметричными текстами. Следующий пример разделения пептидов идейно гораздо более сложен Он относится к разделению перевернутых, "зеркальных" последовательностей Эти последовательности имеют, очевидно, одинаковую массу, так что их "чтение" с помощью точного измерения массы макромолекулярного иона невозможно и требует использования методов МС/МС (однако, даже в этом случае, возможны ситуации, когда спектры фрагментации не позволят различить пары зеркальных изомеров)

Для доказательства возможности разделения «зеркальных» пептидов были синтезированы последовательности типа H-GALYIYLGDGLDTADAEG-amide и Н-GEADATDLGDGLYIYLAG-amide, отличающиеся "переворотом" внутренней части последовательности

шАи

200 -

100

400

300 ■

200 ■

100

Рис 5 Разделение "зеркальных" пептидов типа Н-0АЬУ1У1ХЮ01ЛЭТА0АЕ0-атк1е (1) и Н-СЕАВАТ01ХШ0ЬУ1УЬА0-агш<1е (2), (а), и Н - ОАЬУ1У1ХЮОЬОТАОАЕО - ОН (3) и Н - йЕ АОАТОЦЗООЬУ1УЬАО - ОН (4), (б) Расчетные в рамках модели ВюЬССС и экспериментально наблюдаемые времена удерживания соответственно 42 04 мин и 45 34 мин (1), 43 92 мин и 48 22 мин (2), 41 99 мин и 45 70 мин (3), 43 83 мин и 48 31 мин (4)

Также были синтезированй те же последовательности, отличающиеся типом концевой группы на С- конце H-GALYIYLGDGLDTADAEG-OH и H-GEADATDLGDGLYIYLAG-OH Зеркальные последовательности можно также представить как "перестановку" концевых аминокислотных остатков

Как показано на рис 5(a) и 5(6), такие последовательности действительно разделяются в полном соответствии с предсказаниями теории BioLCCC Естественно, что разделение таких структур не следует из аддитивной модели предсказания времен удерживания или ее аналогов Здесь практически в чистом виде проявляется эффект связанности остатков в цепь и коллективный характер их взаимодействия с поверхностью Учет влияния перестановки аминокислотных остатков в цепи на статистическую сумму гетерополимера вблизи поверхности несложно сделать в рамках подхода, развитого в работе Отметим также существенную роль гетерогенности цепи для макромолекул гомополимера перестановка разных концевых групп вырождена в смысле взаимодействия с поверхностью

Практическое применение модели BioLCCC для фильтрации и верификации результатов поиска по базам данных в процессе идентификации пептидов и белков на примере Escherichia Coli. Наиболее очевидной областью применения разработанной модели для предсказания хроматографических времен удерживания являются задачи идентификации уже изученных белков и/или секвенирование новых Как уже отмечалось, хроматография в данном случае дает дополнительную информацию о первичной структуре биомолекулы В целом, сам процесс идентификации белков может быть разбит на четыре последовательных шага (1) получение хромато-масс-спектрометрических данных для выбранного образца, (2) фильтрацйя полученных данных и генерация листа масс для дальнейшей обработки, (3) поиск по белковым базам данных, который осуществляется специальной программой (например, Mascot, SEQUEST и т д) на основе сгенерированного листа значимых экспериментальных данных, и, (4) верификация результатов поиска Уже на данном этапе разработок модель BioLCCC может быть интегрирована в процесс определения аминокислотной последовательности пептидов для фильтрации неверных масс-спектрометрических идентификаций Обсуждаются несколько вариантов использования модели на разных стадиях процесса идентификации (1) непосредственно при поиске, когда модель интегрирована в поисковую машину, (2) при выборе наиболее достоверной идентификации из всего списка совпадений, найденных во время поиска, или, (3) на стадии проверки окончательных результатов поиска, выданных поисковой машиной Демонстрация возможностей модели была проведена с использованием экспериментальных данных,

полученных для бактерии E.Coli. Отметим, что поиск по базам данных и последующая автоматическая оценка достоверности каждого совпадения экспериментальных MC данных с расчетными, нередко приводит к выявлению 2-3, а то и 10 равноценных совпадений на один н тот же масс-спектр и соответствующий ему МС/МС спектр.

120

Mascot Score

Рис.6. Распределение пептидов-кандидатов в зависимости от индекса достоверности масс-спскгрометрической (Mascol Score) и хроматографической идентификаций (BioLCCC Score).

В этом случае, поисковая программа выбирает пептидную последовательность, соответствующую белку, для последовательности которого в данном поиске уже было сделано максимальное количество пептидных идентификаций, что, очевидно, может быть не вполне корректно Однако если проанализировать всех кандидатов на соответствие расчетных и экспериментально наблюдаемых времен удерживания, то ряд кандидатов удается отсеять. Так, на рис. б на примере пептидов Б-Colt показано распределение идентификаций по Двум измерениям: достоверность масс-спектрометр и ческой

идентификации (Mascot score) и относительное отклонение экспериментальных времен удерживания от расчетных величин (BioLCCC score)

Из рисунка 6 видно, что чем меньше достоверность МС идентификации, тем больше отклонение экспериментального времени удерживания от рассчитанных значений Этот факт демонстрирует и подтверждает, что использование предсказания времени удерживания позволит повысить достоверность результатов поиска по базам данных

Основные результаты и выводы.

1 Предложена физическая модель хроматографического разделения биополимеров, белков и пептидов, учитывающая связанность аминокислотных остатков в цепь и макромолекулярный характер поведения биомолекул при их взаимодействии с поверхностью адсорбента

2 Развита количественная теория градиентной хроматографии биополимеров, в основе которой лежит концепция жидкостной хроматографии в критических условиях

3 Теоретически показано, что в условиях градиентного элюирования, разделение биополимеров, и, следовательно, времена удерживания в колонке, определяются их критическими условиями (состав смеси бинарного растворителя, температура), соответствующими балансу между энергией взаимодействия аминокислотных остатков с поверхностью и энтропийными потерями цепи аминокислотных остатков биополимера

4 С использованием развитых теоретических подходов определены энергии взаимодействия с поверхностью обращенной фазы для 20 наиболее распространенных в природе аминокислотных остатков и 4 типов концевых групп, которые являются феноменологическими параметрами предложенной модели хроматографического разделения биополимеров

5 Экспериментально и теоретически показано, что предложенная макромолекулярная модель хроматографического разделения биополимеров позволяет предсказывать объем или время удерживания биомолекул в зависимости от их аминокислотной последовательности

6 Показано, что предложенная модель хроматографического разделения биополимеров позволяет количественно и качественно определять порядок выхода биополимеров, отличающихся либо изомерными, либо модифицированными формами аминокислотных остатков

7 Экспериментально показана возможность использования модели критической хроматографии биополимеров в сочетании с масс-спектрометрией в протеомных исследованиях определения первичной структуры биополимеров, идентификации посттрансляционных модификаций, и секвенировании неизвестных белков и пептидов (de novo секвенирование)

Список публикаций*

1 А В Горшков, В В Евреинов, И А Тарасова, М В Горшков О применимости концепции критической хроматографии к задачам протеомики Зависимость времени удерживания от последовательности аминокислотных остатков в цепи Высокомолекулярные соединения, Б, 2007, т 49, №4, с 732-749

2 А V Gorshkov, Т A Tarasova, V V Evreinov, М М Savitski, М L Nielsen, R A Zubarev, М V Gorshkov Liquid Chromatography at Critical Conditions Towards a Comprehensive Approach to Sequence Dependent Retention Time Prediction, Analytical Chemistry, 2006, V 76, 7770-7777

3 MB Горшков, А В Горшков, В В Евреинов, И А Тарасова, Масс-спектрометрия и жидкостная хроматография в критической точке Новый подход к изучению биомолекул, 2-й Съезд Всероссийского масс-спектрометрического общества «Масс-спектрометрия и ее прикладные проблемы», 2005, Москва, Россия

4. I A Tarasova, А V Gorshkov, V V Evreinov, О N Kharybin, М V Gorshkov, А Concept of Liquid Chromatography at Critical Conditions m Combination With Mass Spectrometry From Polymers to Biopolymers, Proceedings of the 53rd Conference of American Society for Mass Spectrometry, 2005, San Antonio, USA

5 I A Tarasova, A V Gorshkov, V V Evremov, A A Goloborodko, S S Chitov, M L Nielsen, R A Zubarev, and M V Gorshkov, Towards High Throughput Proteomics Liquid Chromatography at Critical Conditions/Mass Spectrometry, Proceedings of the 17th International Mass Spectrometry Conference, TuP252, p 185, 28 August - 1 September, 2006, Prague, Czech Republic

6 И А Тарасова, Д А Толмачев, С С Шитов, М JI Придатченко, А Ю Агапов, А А Голобородько, А В Горшков, Р А Зубарев, В В Евреинов, М В Горшков, Жидкостная хроматография в критических условиях новый метод идентификации

аминокислотных последовательностей биомолекул, XLIX Научная конференция Московского физико-технического института, 2006, Москва, Россия

7 Irina A Tarasova, Alexander V Gorshkov, Victor V Evreinov, Roman A Zubarev, Mikhail V Gorshkov, BioLCCC-MS/MS Tools a Comprehensive Approach to Sequence Dependent Retention Time Prediction, Proceedings of the 54th Conference of American Society for Mass Spectrometry, WP526, 28 May - 1 June, 2006, Seattle, USA

8 И А Тарасова, А В Горшков, В В Евреинов, М В Горшков, «Идентификация первичной структуры с использованием концепции жидкостной хроматографии в критических условиях», Материалы 3-ей Школы-семинара «Масс-спектрометрия в химической физике, биофизике и экологии», стр 92-93, 16-22 апреля, 2007, Звенигород, Россия

Отпечатано в типографии ООО «Принт» г Ногинск ул 200 летия города д 2 Заказ № 314 тираж 100 экз

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Тарасова, Ирина Алексеевна

Общая характеристика работы.

1. Введение. Основные представления о предмете исследований.

1.1 Масс-спектрометрия как основной метод исследования биомолекул в протеомике.

1.2 Модели предсказания хроматографических времен удерживания белков и пептидов по их аминокислотной последовательности.

1.3 Жидкостная хроматография в критических условиях как метод исследования синтетических полимеров.

2. Теоретические основы концепции жидкостной хроматографии в критических условиях.

2.1 Модель случайных блужданий для гетерополимеров.

2.2 Эффективная энергия взаимодействия биомакромолекулы с поверхностью твердой фазы в градиентной хроматографии.

2.3 Основное уравнение градиентной хроматографии.

2.4 Система уравнений модели BioLCCC для определения объемов/времен удерживания пептидов.

3. Определение феноменологических параметров.

4. Апробация модели на экспериментальных данных.

4.1 Экспериментальные условия и методы исследования.

4.2 Корреляция экспериментальных и предсказанных времен удерживания на примере пептидных стандартов и дайджеста белков бактерии Escherichia Coli.

4.3 Предсказание разделения пептидов с модифицированными аминокислотными остатками на примере изомеров лейцин и изолейцин.

4.4 Предсказание разделения последовательностей с перестановкой аминокислот на примере пептидов с зеркально-симметричными текстами.

4.5 Практическое применение модели BioLCCC для фильтрации и верификации результатов поиска по базам данных в процессе идентификации пептидов и белков на примере Escherichia Coli.

 
Введение диссертация по физике, на тему "Жидкостная хроматография в критических условиях в сочетании с масс-спектрометрией для изучения первичной структуры биомолекул"

Введение. Актуальность проблемы. В настоящее время задача определения первичной структуры белка, т. е. его аминокислотной последовательности, решается преимущественно методами тандемной масс-спектрометрии (МС/МС). В первую очередь это связано с тем, что масс-спектрометрический метод секвенирования белков является самым быстрым из всех известных. В протеомных исследованиях для осуществления МС/МС секвенирования распространение получили масс-анализаторы типа квадрупольной радиочастотной ловушки, времяпролетные масс-спектрометры, спектрометры ионного циклотронного резонанса, а также совсем новый тип масс-анализатора, получивший название "орбитальная ионная ловушка" (orbitrap). Масс-спектрометрия добилась несомненных успехов в области исследования и идентификации структуры белков и пептидов, а также в решении других задач протеомики и биоинформатики. В то же время многие исследователи отмечают высокий процент ложных идентификаций пептидов, а, следовательно, и белков, если определение их аминокислотной последовательности проводится исключительно по масс-спектрометрическим данным. В связи с этим существует необходимость развития новых, отличных от масс-спектрометрии, методов определения и идентификации аминокислотных последовательностей. Естественным представляется использование для этих целей высокоэффективной жидкостной хроматографии (ВЭЖХ). Во-первых, перечисленные выше типы масс-спектрометров работают "в связке" с хроматографом, позволяющим разделять сложные смеси пептидов, образующихся в результате ферментативного гидролиза белков, и, тем самым, упростить их МС/МС анализ. Во-вторых, хроматографическое разделение основано на взаимодействии макромолекулы с поверхностью, и это взаимодействие также отражает характер чередования аминокислотных остатков в цепи. Однако до 4 последнего времени хроматографические данные, т.е. объем или время удерживания, мало использовались или вообще не использовались для определения аминокислотной последовательности пептидов. Несмотря на возросший в последнее время интерес к хроматографии как к источнику дополнительной информации о первичной структуре пептидов и белков, до сих пор не было предложено такой содержательной физической теории, описывающей процессы разделения биомакромолекул, которая позволила бы связать закономерности разделения с "текстом" аминокислотной последовательности. Все существующие методики предсказания удерживания пептидов с известной последовательностью строились либо на основе моделей, развитых для низкомолекулярных соединений, либо на основе систем искусственного интеллекта. Это в лучшем случае позволяло "определить" средний аминокислотный состав пептида, но не характер чередования аминокислотных остатков в цепи.

Цель и задачи исследования. Основной целью и задачами работа были (1) разработка модели хроматографического разделения биомакромолекул (BioLCCC), учитывающей зависимость их хроматографического удерживания от первичной структуры -последовательности аминокислотных остатков; (2) экспериментальная верификация предложенной модели для предсказания времени и порядка выхода биомакромолекул с разными "текстами" в условиях градиентной хроматографии; (3) интеграция данных по последовательности цепи, получаемых в рамках развитого хроматографического подхода, с существующими экспертными системами МС/МС секвенирования для повышения достоверности идентификации белков и пептидов.

Научная новизна.

1. Впервые предложена физическая модель, описывающая взаимодействие связанных в цепь аминокислотных остатков биомакромолекулы с поверхностью, и учитывающая зависимость взаимодействия (статистической суммы) от их последовательности в цепи.

2. Впервые известная концепция жидкостной хроматографии в критических условиях, развитая ранее для исследования строения цепи синтетических полимеров, применена для описания разделения биомакромолекул в ВЭЖХ, в том числе и в условиях градиентной хроматографии.

3. Впервые экспериментально найдены эффективные энергии адсорбции 20 наиболее распространенных в природе аминокислотных остатков, а также концевых групп пептидов с гидрофобной поверхностью типа С]8.

4. Впервые модель хроматографического разделения пептидов применена, в том числе совместно с экспертными системами МС/МС секвенирования, для определения последовательностей пептидов, для идентификации модифицированных участков аминокислотных последовательностей, вызванных либо пострансляционными модификациями белков, либо мутациями в процессе их синтеза, либо перестановками аминокислотных остатков.

Практическое значение работы. Полученные результаты могут быть использованы исследователями, работающими в области протеомики, для решения следующих проблем:

S предсказания времен удерживания биомакромолекул с известной последовательностью, что позволит повысить достоверность идентификации пептидов и белков, полученных в результате хромато-масс-спектрометрического анализа;

S определения аминокислотных последовательностей неизвестных или отсутствующих в протеомных базах данных белков (de novo sequencing);

S определения или идентификации типа и места посттрансляционных модификаций в аминокислотной последовательности, а также изомерных аминокислот.

Личный вклад автора. Материал, представленный в диссертации, получен при непосредственном участии автора в постановке задач исследований, в выполнении экспериментов и в обсуждении полученных результатов. Диссертационная работа выполнена на кафедре химической физики Московского физико-технического института в лаборатории физических основ и техники масс-спектрометрии биополимеров Института энергетических проблем химической физики РАН в период с 2004 по 2007 год.

Апробация работы. Результаты работы докладывались и обсуждались на следующих российских и международных конференциях: 2-й Съезд Всероссийского масс-спектрометрического общества "Масс-спектрометрия и ее прикладные проблемы", 2005, Москва, Россия, 53-я Конференция Американского масс-спектрометрического общества, 2005, Сан Антонио, США, 17-я Международная масс-спектрометрическая конференция, 2006, Прага, Чехия, XLIX Научная конференция Московского физико-технического института, 2006, Москва, Россия, 54-я Конференция Американского масс-спектрометрического общества, 2006, Сиэтл, США, 3-я Школа-семинар "Масс-спектрометрия в химической физике, биофизике и экологии", 2007, Звенигород, Россия.

Публикации. Основное содержание диссертационной работы опубликовано в статьях, список которых приведен на стр. 95-96 диссертации. Работы, вошедшие в диссертацию, были выполнены при поддержке РФФИ (гранты №№ 03-04-48228, 06-04-49632), Российской Академии Наук (ОХНМ 4.2), CRDF (гранты №№ RUC1-5031-MO-04, RUE1-О00588-М0-05), и INTAS (Young Scientist Fellowship №04-83-2643 и Genomics-05-1000004-7759).

Изложение в диссертации построено следующим образом:

 
Заключение диссертации по теме "Химическая физика, в том числе физика горения и взрыва"

Заключение и выводы

В рамках данной работы была не только разработана достаточно корректная физическая модель хроматографического разделения пептидов, BioLCCC, но и проведено сравнение полученных с ее использованием результатов с альтернативным подходом к предсказанию удерживания в рамках модели SSRcalc. В заключение обсудим еще раз преимущества и недостатки данных моделей удерживания. Остановимся подробнее на конкретных примерах, показывающих различие в работе сравниваемых моделей предсказания удерживания. Рассмотрим перестановку концевых групп или «зеркальные» последовательности, описанные ранее в данной работе. Этот пример эквивалентен "перевороту" текста последовательности слева направо. Вообще говоря, не вполне очевидно, почему удерживание таких "перевернутых" последовательностей должно различаться. Впрочем, оно и не различается для гомополимера. Однако, если мы имеем дело с гетерополимером (пептидом), составленным из мономеров с разными энергиями притяжения, то перестановка концов по-разному влияет на все другие мономеры цепи. Это приводит к тому, что макромолекулы с "перевернутым" текстом могут разделяться, что и было продемонстрировано экспериментально (Рис. 15). Немаловажно отметить при этом, что концепция жидкостной хроматографии в критических условиях позволила правильно увидеть порядок выхода таких «зеркальных» пептидов. Модель SSRcalc в свою очередь не видит почти никакого различия в удерживании таких последовательностей при градиенте 1% В/мин, а при более медленном градиенте дает обратный экспериментальному порядок выхода пептидов

Последовательность Эксперимент BioLCCC SSRcalc

H-GALYIYLGDGLDTADAEG-amide 45.34 42.04 N/A

H-GEADATDLGDGLYIYLAG-amide 48.22 43.92 N/A

H-GALYIYLGDGLDTADAEG-OH 45.70 41.99 45.0

H-GEADATDLGDGLYIYLAG-OH 48.31 43.83 44.8

Так, в данной таблице приведены экспериментально измеренные и рассчитанные в рамках моделей BioLCCC и SSRcalc времена удерживания. Отметим, что в данном случае расчет по модели SSRcalc проводился для значений а = 22 мин, Ь = 0.63. Кроме того, в настоящее время модель SSRcalc позволяет делать расчет только для пептидов, имеющих концевые группы Я -peptide- ОН.

Другой пример также интересен. При экспериментах с пептидами белка Cytochrome С было замечено, что порядок выхода пептидов, характеризующихся близкими временами удерживания, инвертируется при замене градиента на более медленный (Рис. 26). Интересным и несколько неожиданным оказался тот факт, что разработанная в настоящей работе модель позволяет предсказать изменение порядка выхода таких пептидов при изменении градиента на более медленный! Не будет преувеличением утверждение, что на сегодняшний день это вообще единственная модель позволяющая увидеть и предсказать такой эффект. Физическая природа обнаруженного эффекта для пептидов с близкими временами удерживания может быть объяснена с позиции критической хроматографии следующим образом. Напомним, что непрерывный переход через критическую область

Gradient from 0 to 50%B in 30 min

Gradient from 0 to 35%B in 120 min

100| 9S| 90|

8 "J a «of sH

S 701 «ol « ssj «1 u 401

OS jsl

301 251 20| IS 1 101 S|

25.29

1 I TGPNLHGLFGR 1

1 1 1 25.68

1 1 1 1 1АЯЕ4<Ж

24 26 2« 30

Time, min

61.48

TGPNLHGLFGR

60.59.

MIFAGIK л Л .J,,,,,,,,,.

Time, min

Gradient from 0 to 50%B in 30 min Gradient from 0 to 35%B in 120 min

Peptide TGPNLHGLFGR MIFAGIK TGPNLHGLFGR MIFAGIK

RT„p 25.29 25.68 61.48 60.59

BioLCCC 25.15 26.05 61.77 60.00

SSRCalc 25.3 26.60 60.80 67.6

Рис. 26. Экспериментальное наблюдение изменения порядка выхода пептидов, имеющих близкие времена удерживания, при изменении условий градиентного элюирования [Gorshkov M.V. et al, готовится к печати]. для гетерополимера осуществляется не только на пути от эксюпозионного в адсорбционный режим хроматографии, но и, наоборот, при переходе от адсорбции к эксюпозии. Резкий градиент, реализующийся когда содержание ацетонитрила в бинарном растворителе быстро нарастает, соответствует ситуации, когда мы движемся к критической области со стороны эксюпозионного режима и в итоге пептид с более длинной последовательностью выходит из колонки первым. В то же время, медленный градиент соответствует обратной ситуации, когда во время элюирования преобладает адсорбционный режим, удерживание в котором тем больше, чем длиннее аминокислотная последовательность пептида.

Сравниваемые модели используют принципиально различные подходы к описанию и пониманию процесса хроматографического разделения пептидов. Если модель, предложенная и разработанная нами, отталкивается от феномена адсорбции и описывает поведение биомолекулы как .макромолекулы, с использованием методов статистической физики, то модель SSRcalc рассматривает биомолекулы как низкомолекулярные соединения, исходя из понятия гидрофобности пептида как основополагающего явления в хроматографии. Отметим, что аддитивный подход безусловно справедлив для низкомолекулярных соединений или достаточно коротких пептидов, т.к он неявно предполагает, что пептид лежит на поверхности «целиком» и взаимодействует с ней сразу всеми аминокислотами. Однако при увеличении длины цепи до 10-15 аминокислот удерживание заметно отклоняется от простой аддитивной модели. Поэтому дальнейшее развитие аддитивных моделей, и модели SSRcalc, в частности, строится на приведении в соответствие экспериментальных данных с предсказаниями путем введения в рассмотрение сложных нелинейных функций, аргументом которых, однако, по-прежнему остается суммирование коэффициентов удерживания аминокислот. Тем самым удается достаточно точно предсказать общие тенденции удерживания для цепей длиной 20-30 остатков - типичных для протеомных исследований.

Последовательности с одним и тем же аминокислотным составом, но различающиеся перестановками аминокислот, могут иметь разные объемы удерживания. Поэтому, следуя логике хроматографии низкомолекулярных соединений, в модели SSRcalc вводится понятие "эффекта соседа", и теория дополняется корректирующими параметрами, учитывающими влияние ближайших соседей мономера, взаимодействующего с поверхностью. Например, можно ввести различие во взаимодействии с поверхностью В в окружении А , А -В - А или в окружении В, В -В - В. Тем самым, вводя поправочные коэффициенты можно уточнять модель разделения и учесть, в том числе, и возможность разделения по текстам последовательности. В рамках модели BioLCCC, физическая причина различия в адсорбционном взаимодействии при перестановке мономеров в цепи лежит в связанности остатков в цепь и коллективном характере взаимодействия.

Аддитивная модель предполагает, что цепь целиком лежит на поверхности и все остатки взаимодействуют с поверхностью, однако, для длинных цепей это не так. Даже для гомополимеров равновесная конфигурация адсорбированной макромолекулы включает не только лежащие на поверхности (и взаимодействующие с ней) мономеры, но также и мономеры в петлях, простирающихся достаточно далеко в раствор, где мономеры не взаимодействуют с поверхностью. То же самое можно сказать и в отношении пептидов: наряду с сильно адсорбирующимися или, другими словами, гидрофобными остатками в цепи присутствуют и гидрофильные, отталкивающиеся от поверхности и способные образовывать петли, уходящие в раствор. Такая возможность учитывается в модели SSRcalc следующим образом. Обычно хроматография пептидов проводится на обращенной фазе в условиях, когда N - конец оказывается заряженным (в форме H3+N-) . Заряженность этого конца означает его сильное отталкивание от гидрофобной поверхности обращенной фазы ("изображение" заряда на гидрофобной поверхности имеет тот же знак, что и сам заряд). Тем самым, N - конец стремиться уйти подальше от поверхности, и утащить ковалентно привязанные к нему остатки. Следовательно, привязанные к N- концу остатки оказываются также удаленными от поверхности и их вклад во взаимодействие изменяется. Более того, оказывается существенным, какие остатки, гидрофобные или гидрофильные привязаны к N - концу. Очевидно, что если переставить местами остатки вблизи N - конца, то эффект такой перестановки может быть заметным. Таким образом, оказывается возможным "увидеть" элементы текста цепи вблизи N - конца, т.е. опять таки связать разделение не только с аминокислотным составом, но и с текстом. Такой подход значительно расширил возможности модели SSRcalc.

Тем не менее, предсказание объемов удерживания для пептидов с известным текстом в аддитивной модели основывается на рассмотрении пептидов "со стороны" низкомолекулярных соединений, т.е. рассмотрении их как "длинных" низкомолекулярных соединений. Собственно полимерная природа цепи при таком рассмотрении "учитывается" путем эмпирических поправок. Вместе с тем причина зависимости удерживания от последовательности имеет как раз полимерный характер. Если с самого начала положить в основу рассмотрения взаимодействия пептидов с поверхностью их полимерную природу, т.е. рассматривать их не как длинные низкомолекулярные соединения, а как короткие макромолекулы, то такое изменение точки зрения имеет определенные и обоснованные преимущества. В частности, при таком рассмотрении зависимость удерживания от текста цепи возникает естественным образом без необходимости задания множества дополнительных эмпирических параметров.

В чем же преимущество предлагаемой модели по сравнению с SSRcalc? Во-первых, в отличие от суммы индивидуальных свойств аминокислот, мы имеем произведение матриц, отражающих их индивидуальные свойства - энергии адсорбции аминокислотных остатков пептида. Свойства произведения матриц позволяют связать объем удерживания именно с текстом последовательности. Произведение матриц некоммутативно и, следовательно, зависит от порядка перемножения, задаваемого текстом последовательности.

Во-вторых, рассмотрение разделения пептидов "со стороны макромолекул" дает возможность проанализировать возможности хроматографии для чтения текста и интерпретации различий в разделении пептидов в терминах слабой дефектности в структуре (модификаций). Ясно, однако, что в общем случае такое соответствие цепи блужданий реальной макромолекуле пептида или белка (даже находящегося в клубкообразном состоянии) не вполне адекватно реальной ситуации. (Грубо говоря, в модели блужданий несколько "преувеличена" энтропийная составляющая во взаимодействии макромолекулы, а в аддитивной модели энтропийная составляющая, наоборот, сильно приуменьшена.)

Привязка модели BioLCCC к реальной системе осуществляется с помощью набора 20 феноменологических параметров - эффективных энергий взаимодействия, определяемых экспериментально. По сути, эффективная энергия адсорбции - это единственный нетривиальный параметр разработанной нами модели. Очевидно, что это эффективная энергия зависит от типа поверхности, от состава и компонентов растворителя и температуры.

Поскольку взаимодействие аминокислотных остатков с поверхностью ничем не отличается от взаимодействия низкомолекулярного аналога, для определения зависимости элюирующей силы растворителя в модели BioLCCC можно использовать корреляционную теорию, разработанную для низкомолекулярных веществ. Для рассматриваемой модели и формы переходной матрицы естественным является подход Снайдера, хотя он и не часто применяется в хроматографии на обращенной фазе. Возможно на обращенной фазе это действительно не лучшая модель, но она весьма проста и ее степень приближения соответствует степени приближения модели блужданий - в последней также пренебрегается взаимодействием с растворителем. Параметр, описывающий силу растворителя, имеет простой физический смысл эффективной энергии адсорбции компонента растворителя.

Такой подход содержит сильное допущение: пренебрежение взаимодействиями в растворе. Однако это предположение позволило нам «расцепить» свойства макромолекулы и растворителя (в смысле взаимодействия с поверхностью) и учесть влияние изменения состава растворителя на эффективную энергию взаимодействия.

Во избежание недоразумений, говоря в модели BioLCCC о влиянии перестановки на взаимодействие с поверхностью других мономеров, необходимо еще раз отметить следующее. Рассматриваемое влияние перестановки не связано с тем, что энергия взаимодействия аминокислотного остатка зависит от того, какие аминокислоты (ближайшие соседи) окружают его в аминокислотной последовательности. Так, в модели BioLCCC все энергии аминокислотных остатков, приведенные в таблице 1, фиксированы, но при перестановках в цепи меняются условия их взаимодействия с поверхностью (т.е. вероятность столкновения с поверхностью). В модели SSRcalc коэффициенты удерживания различны для одной и той же аминокислоты в зависимости от длины пептида и расположения аминокислоты в последовательности, т.е. зависят от ближайших соседей (т.е. удерживание мономера В в окружении А отличается от его удерживания в окружении С). Нельзя сказать, что такой подход неверен и «эффект ближайшего соседа» не имеет значения. Возможно, что именно этот эффект является доминирующим в изменении адсорбционного взаимодействия при перестановке мономеров. Однако нами было показано, что даже при пренебрежении влиянием ближайшего соседа на общее удерживание пептида перестановка остатков в цепи все равно приводит к изменению адсорбционного взаимодействия. В целом, какое явление является определяющим в изменении удерживания при перестановках, «влияние ближайшего соседа» или связанность мономеров в цепь - покажут будущие исследования.

Еще один важный вопрос - влияние модификации аминокислотного остатка и места расположения этой модификации в аминокислотной последовательности на хроматографическое удерживание пептида. Модификация аминокислоты (например, посттрансляционная) в рамках концепции жидкостной хроматографии в критических условиях меняет ее энергию взаимодействия, а сам по себе этот факт может быть легко обнаружен по изменению массы пептида, а также и по изменению объема удерживания. В рамках аддитивной модели модификации легко учитываются, так что интерпретация хроматографических данных в этом случае проще, чем при перестановке звеньев в цепи. Однако, интересен не только сам факт однократной или многократной модификации цепи, но и место, где произошла такая модификация. В такой постановке задача заметно усложняется и для определения места модификации необходимо прибегать к секвенированию. Изменение взаимодействия с поверхностью одного из мономеров меняет не только его условия взаимодействия с поверхностью, но и «привязанных» к нему соседей по цепи. Таким образом, общее взаимодействие всей цепи зависит от того, в каком месте цепи произошла модификация. Модель BioLCCC предсказывает, что пептиды должны разделяться также и по месту замененной группы.

Предложенный подход представляет собой, образно говоря, "первое приближение" к решению проблемы - многие детали строения реальной структуры пептида оказываются за рамками рассмотрения, однако, они, в принципе, способны заметно "исказить" нарисованную выше идеальную картину. Поэтому следует отметить и "слабые места" предложенной модели, в частности, для того чтобы более корректно соответствовать экспериментальным данным в будущем.

Сам факт представления об аминокислотной последовательности пептида как о цепи случайных блужданий, конечно, явно модельное приближение. Достаточно длинные последовательности, содержащие порядка 100 мономеров, в денатурированном, клубкообразном состоянии, как и макромолекулы обычных синтетических полимеров, достаточно хорошо моделируются гауссовым клубком. В этом случае предложенная модель правильно отражает физическую суть взаимодействия с поверхностью. Однако короткие пептиды вряд ли можно отождествить с клубком: это могут быть стержни, изогнутые стержни или даже куски спирали. Это не устраняет коллективного характера взаимодействия с поверхностью составляющих их аминокислот, но характер пространственной корреляции, а, следовательно, и влияние текста, уже отличается от гауссового клубка. В общем можно сказать, что для таких слабо флуктуирующих пептидов аддитивная модель скорее ближе к реальности. В этом случае существенны только перестановки вблизи концов цепи на расстоянии порядка радиуса взаимодействия с поверхностью, перестановки же мономеров в середине несущественны. Вообще говоря, нет особых проблем учесть жесткость цепи и в модели блужданий (введением, например, разной вероятности перехода вперед и вбок). Сложность модели при этом возрастет незначительно. Однако следует помнить, что жесткость цепи также может зависеть от первичной последовательности, и для корректного учета потребуется введение, а главное, экспериментальное определение новых параметров, отражающих упомянутое явление.

Другое очевидное ограничение модели BioLCCC - предположение о локальности взаимодействия, присутствующее в модели (и, как следствие, в переходной матрице (1)). Реальные пептиды содержат ионногенные группы (К, R, Н), которые в условиях хроматографического эксперимента обладают положительным зарядом. Действительно, экспериментально было обнаружено, что для пептидов, содержащих более двух сильно заряженных аминокислот, предсказанные по модели BioLCCC времена удерживания оказываются всегда больше, чем регистрируемые на опыте. Кроме того, электростатическое отталкивание заряженных аминокислот от гидрофобной поверхности является, конечно, нелокальным. Однако нелокальность взаимодействия также можно учесть в рамках предложенной модели, вводя в переходную матрицу взаимодействие со второго слоя. В настоящий момент это еще не реализовано и находится в стадии разработок. Отметим, что в модели SSRcalc на данный момент уже введены эмпирические поправки, позволяющие учитывать наличие сильно заряженных аминокислотных остатков в цепи и их влияние на удерживание пептидов.

Считаем нужным отметить, что предложенная модель BioLCCC не специфична к конкретному типу взаимодействий и может быть применена для описания других вариантов хроматографического разделения белков и пептидов, например, в ионнообменной или аффинной хроматографии. Для применимости модели к другим вариантам хроматографии, конечно, необходимо переопределить стандартные энергии адсорбции остатков для фаз и растворителей, применяемых в этих вариантах хроматографии с помощью модельных пептидов, как это было сделано для обращенной фазы Cig. Модель SSRcalc также может быть применена к описанию других вариантов хроматографии, однако, переопределение параметров данной модели в виду их большого количества (порядка нескольких сотен) потребует значительно более долгой и кропотливой работы.

Упомянутые выше ограничения на предложенную нами модель должны быть предметом дальнейших теоретических и экспериментальных исследований.

Тем не менее, несмотря на ограничения, предлагаемый нами подход является продуктивным и обоснованным и позволяет более эффективно вовлекать хроматографические данные в протеомный анализ при идентификации и секвенировании пептидов и белков.

Сформулируем кратко основные результаты и выводы, полученные в данной работе:

1. Предложена физическая модель хроматографического разделения биополимеров, белков и пептидов, учитывающая связанность аминокислотных остатков в цепь и макромолекулярный характер поведения биомолекул при их взаимодействии с поверхностью адсорбента.

2. Развита количественная теория градиентной хроматографии биополимеров, в основе которой лежит концепция жидкостной хроматографии в критических условиях.

3. Теоретически показано, что в условиях градиентного элюирования разделение биополимеров и, следовательно, времена удерживания в колонке определяются их критическими условиями (состав смеси бинарного растворителя, температура), соответствующими балансу между энергией взаимодействия аминокислотных остатков с поверхностью и энтропийными потерями цепи аминокислотных остатков биополимера.

4. С использованием развитых теоретических подходов определены энергии взаимодействия с поверхностью обращенной фазы для 20 наиболее распространенных в природе аминокислотных остатков и 4 типов концевых групп, которые являются феноменологическими параметрами предложенной модели хроматографического разделения биополимеров.

5. Экспериментально и теоретически показано, что предложенная макромолекулярная модель хроматографического разделения биополимеров позволяет предсказывать объем или время удерживания биомолекул в зависимости от их аминокислотной последовательности.

6. Показано, что предложенная модель хроматографического разделения биополимеров позволяет количественно и качественно определять порядок выхода биополимеров, отличающихся либо изомерными, либо модифицированными формами аминокислотных остатков.

7. Экспериментально показана возможность использования модели критической хроматографии биополимеров в сочетании с масс-спектрометрией в протеомных исследованиях: определения первичной структуры биополимеров, идентификации посттрансляционных модификаций и секвенировании неизвестных белков и пептидов (de novo секвенирование).

 
Список источников диссертации и автореферата по физике, кандидата физико-математических наук, Тарасова, Ирина Алексеевна, Москва

1. Wong S.F., Meng C.K., Fenn J.B., "Multiple Charging in Electrospray 1.nization of Poly(Ethylene Glycols)", J. Phys. Chem., 92(2), pp. 546-550 (1988).

2. Tanaka K., Waki H., Ido Y., Akita S., Yoshida Y., Yoshida Т., "Protein and Polymer Analyses up to m/z 100 000 by Laser Ionization Time-of-Flight Mass Spectrometry", Rapid Commun. Mass Spectrom., 2(8), pp. 151-153 (1988).

3. Brancia F.L., "Recent developments in ion-trap mass spectrometry and related technologies", Expert Review of Proteomics, 3(1), pp. 143-151 (2006).

4. Roepstorff P., "MALDI-TOF mass spectrometry in protein chemistry", EXS., 88, pp. 81-97 (2000).

5. Marshall A.G., Verdun F.R., "Fourier transforms in NMR, optical, and mass spectrometry", A User's Handbook, Elsevier Science Publishing Company Inc., New York, pp. 450 (1990).

6. Makarov A., "Electrostatic axially harmonic orbital trapping: a high performance technique of mass analysis", Anal. Chem., 72(6), pp. 1156-62 (2000).

7. Pandey A., Mann M., "Proteomics to study genes and genomes", Nature, 405(6788), pp. 837-846 (2000).

8. Aebersold R., Mann M., "Mass spectrometry-based proteomics", Nature, 422, pp. 198-207 (2003).

9. Wells J.M., McLuckey S.A., "Collision-induced dissociation (CID) of peptides and proteins", Methods Enzymol., 402, pp. 148-185 (2005).

10. Little D.P., Speir J.P., Senko M.V., O'Connor P.B., McLafferty F.W., "IRMPD of large multiply charged ions for biomolecule sequencing", Anal Chem., 66(18), pp. 2809-15 (1994).

11. Zubarev R.A., Kelleher N.L., McLafferty F.W., "ECD of multiply charged protein cations. A nonergodic process", J. Am. Chem. Soc., 120(13), pp. 3265-3266 (1998).

12. Syka J.E., Coon J.J., Schroeder M.J., Shabanowitz J., Hunt D.F., "Peptide and Protein sequence analysis by ETD MS", PNAS, 101(26), pp. 9528-33; 10.1073/pnas.0402700101 (2004).

13. Abbott A., "A post-genomic challenge: learning to read patterns of protein synthesis", Nature, 402, pp. 715-720, (1999).

14. Zubarev R. A., Hakansson P., Sundqvist В., "Accuracy requirements for peptide characterization by monoisotopic molecular mass measurements", Analytical Chemistry, 68(22), pp. 4060-63 (1996).

15. Mann M., Hendrickson R. C., Pandey A., "Analysis of proteins and proteomes by mass spectrometry", Annual Reviews in Biochemistry, 70, pp. 437-473 (2001).

16. Perkins D. N., Pappin D. J. C., Creasy D. M., Cottrell J. S., "Probability based protein identification by searching sequence databases using mass spectrometry data", Electrophoresis, 20(18), pp. 3551-3567 (1999).

17. Eng J. K., McCormack A. L., Yates J. R., "An approach to correlate tandem mass spectral data of peptides with amino acid sequences in a protein database", J. Am. Soc. Mass Spectrom., 5, pp. 976 -989 (1994).

18. Craig R., Beavis R.C., "TANDEM: matching proteins with mass spectra", Bioinformatics, 20, pp. 1466-7 (2004).

19. Geer L.Y., Markey S.P., Kowalak J.A., Wagner L., Xu M., Maynard D.M., Yang X., Shi W., Bryant S.H., "Open Mass Spectrometry Search Algorithm", JProteome Res., 3(5), pp. 958-64 (2004).

20. Meek J.L., "Prediction of peptide retention times in high pressure liquid chromatography on the basis of amino acid composition", Proc. Natl. Acad. Sci. USA, 77(3), p. 1632-1636 (1980).

21. M.T.W. Hearn, M.J. Aguilar, C.T. Mant, R.S. Hodges, "High performance liquid chromatography of amino acids, peptides and proteins. LXXXV.

22. Evaluation of the use of hydrophobicity coefficients for the prediction of peptide elution profiles", J. Chromatography, 438, pp.197-210 (1988).

23. C.T. Mant, T.W.L. Burke, J.A. Black R.S. Hodges, "Effect of peptide chain length on peptide retention behaviour in reversed-phase chromatography", J. Chromatography, 458, pp. 193-205 (1988).

24. Nielsen M. L., Savitski M. M., Zubarev R. A., "Improving Protein Identification Using Complementary Fragmentation Techniques in Fourier Transform Mass Spectrometiy", Mol. Cell Proteom., 4, pp.835- 845 (2004).

25. Sunyaev S., Liska A. J., Golod A., Shevchenko A., Shevchenko A., "MultiTag: multiple error-tolerant sequence tag search for the sequence-similarity identification of proteins by mass spectrometry", Anal. Chem., 75, pp.1307—1315 (2003).

26. Mann M., Wilm M., "Error-tolerant identification of peptides in sequence databases by peptide sequence tags", Anal. Chem., 66(24), pp.4390 4399. (1994).

27. Bern M., Goldberg D., McDonald W. H., Yates J. R., "Automatic quality assessment of peptide tandem mass spectra", 12th International Conference on Intelligent Systems for Molecular Biology (ISMB 2004); 2004 July 31 -August 4; Glasgow; Scotland.

28. McLafferty F. W., Fridriksson E. K., Horn D. M., Lewis M. A., Zubarev R. A., "Biochemistry. Biomolecule mass spectrometry", Science, 21, pp.1289 -1290(1999).

29. Fernandez F. M., Wysocki V.H., Futrell J.H., "Protein identification via surface-induced dissociation in an FT-ICR mass spectrometer and a patchwork sequencing approach", J. Am. Soc. Mass Spectrom., 17 (5), pp.700-709 (2006).

30. Marshall A.G., Hendrickson Ch.L., Jackson G.S., "Fourier Transform Ion Cyclotron Resonance Mass Spectrometry: A Primer", Mass Spectrometry Reviews, 17, pp. 1-35 (1998).

31. Shaffer S.A., Tang K.Q., Anderson G.A., Prior D.C., Udseth H.R., Smith R.D., "A novel ion funnel for focusing ions at elevated pressure using electrospray ionization mass spectrometry", Rapid Commun. Mass Spectrom., 11, 1813-1817(1997).

32. Gorshkov M.V., Pasa-Tolic L., Bruce J.E., Anderson G.A., Smith R.D., "A dual-trap design and its applications in electrospray ionization FTICR mass spectrometry", Anal Chem., 69, 1307-1314(1997).

33. Palmblad, M.; Ramstrom, M.; Markides, К. E.; Hakansson, P.; Bergquist, "Prediction of Chromatography Retention and Protein Identification in Liquid Chromatography/Mass Spectrometry", J. Anal. Chem., 74, 5826-5830 (2002).

34. Klammer A.A., Yi X., MacCoss M.J., Noble W. S., "Peptide Retention Time Prediction Yields Improved Tandem Mass Spectrum Identification for Diverse Chromatography Conditions", RECOMB 2007, pp. 459-472.

35. Meek J.L., Rossetti Z.L., "Factors affecting retention and resolution of peptides in high performance liquid chromatography", J. Chromatogr., 211(1), p.15-28 (1981).

36. Su S.J., Grego В., Niven В., Hearn M.T.W., "Analysis of Group retention contributions for peptides separated by reversed-phase high performance liquid chromatography", J. Liq. Chromatogr., 4(10), p. 1745-1764 (1981).

37. Wilson K.J., Honegger A., Slottzel R.P., Hughes G.H., "The behaviour of peptides on reversed phase supports during high pressure liquid chromatography", Biochem. J., 199, p.31 (1981).

38. Browne C.A., Bennett H.P.J., Solomon S., "The isolation of peptides by high-performance liquid chromatography using predicted elution positions", Anal. Biochem., 124(1), p.201-8 (1982).

39. Sasagawa Т., Okuyama Т., Teller D.C., "Prediction of peptide retention times in reversed phases high performance liquid chromatography during linear gradient elution", J. Chromatogr., 240(2), p.329-340 (1982).

40. Sasagawa Т., Ericsson L.H., Teller D.C., Titani K., Walsh K.A., "Separation of peptides on a polystyrene resin column", J. Chromatogr., 307, p.29-38 (1984).

41. Sakamoto Y., Kawakami N., Sasagawa Т., "Prediction of peptide retention times", J. Chromatogr., 442, p.69-79 (1988).

42. Palmblad, M.; Ramstrom, M.; Bailey, C. G.; McCutchen-Maloney, S. L.; Bergquist, J.; Zeller, L. C., "Protein identification by liquid chromatography using retention time prediction", J. Chromatogr., B, 803, 131-135 (2004).

43. Azarova I.N., Baram G.I., Gol'dberg E.L., "Prediction of Retention Volumes and UV Spectra of Peptides in Reversed Phase HPLC", Russian Journal ofBioorganic Chemistry, 32(1), pp.50-56 (2006).

44. Baczek, Т., Wiczling, P., Marszall, M., Hey den, Y.V., Kaliszan, R., "Prediction of peptide retention at different hplc conditions from multiple linear regression models", JProteome Res, pp. 555-63 (2004).

45. Lewis D.P., Jebara Т., Noble W.S., "Support vector machine learning from heterogeneous data: an empirical analysis using protein sequence and structure", Bioinformatics, 22(22), pp. 2753-2760 (2006).

46. Ben-Hur A., NobleW.S., "Kernel methods for predicting protein-protein interactions", ISMB (Supplement of Bioinformatics), pp. 38-46 (2005).

47. Ling C.X., Noble W.S., Yang Q., "Guest Editors' Introduction to the Special Issue: Machine Learning for Bioinformatics Part 1", IEEE/ACM Trans. Comput. Biology Bioinform., 2(2), pp.81-82 (2005).

48. Ling C.X., Noble W.S., Yang Q., "Guest Editor's Introduction to the Special Issue: Machine Learning for Bioinformatics-Part 2", IEEE/ACM Trans. Comput. Biology Bioinform., 2(3), pp. 177-178 (2005).

49. Eskin E., Noble W.S., Singer Y., "Protein Family Classification Using Sparse Markov Transducers", Journal of Computational Biology, 10(2), pp. 187-214 (2003).

50. Liao L., Noble W.S., "Combining Pairwise Sequence Similarity and Support Vector Machines for Detecting Remote Protein Evolutionary and Structural Relationships", Journal of Computational Biology, 10(6), pp.85 7-868 (2003).

51. Riddle L. A., Guiochon G., "Influence of Mobile Phase Gradients on the Retention and Separation of Peptides from a Cytochrome-c Digest by Reversed-Phase Liquid Chromatography", Chromatographia, 64, pp. 121— 127 (2006).

52. Кузаев A.M., Суслова E.H., Энтелис С.Г., "Адсорбционные эффекты в гель проникающей хроматографии. II Полистерольные гели", Журн. Физ. Химии, 48(6), 1493-1495 (1974).

53. Де Жен П., Идеи скейлинга в физике полимеров. М.: Мир, 1982, стр. 368.

54. Лифшиц И.М., "Некоторые вопросы статистической теории биополимеров", ЖЭТФ, т. 55, №6, стр. 221 (1968).

55. De Gennes P.-G., "Some Conformation Problems for Long Macromolecules", Rep. Prog. Phys., v.32, p. 187-205 (1969).

56. Hoeve C.A.J., Di Marzio E.A., Peyser P., "Adsorption of Polymer Molecules at Low Surface Coverage", J. Chem. Phys., No.2, pp.2558-2563 (1965).

57. Di Marzio E.A., Rubin R., "Adsorption of Chain Polymer Between Two Plates", J. Chem. Phys., v.55, No.9, p. 4318-4336 (1971).

58. Горшков A.B., «Критическая хроматография макромолекул», диссертация на соискание степени доктора физ.-мат. наук, 2002.

59. Скворцов A.M., Беленький Б.Г., Ганкина Э.С., Тенников М.Б., "О соответствии поведения реальной макромолекулы и гауссовой цепи при адсорбции в порах", Высокомолекулярные соединения, А, т.20, №3, с.678-686 (1978).

60. Горшков А.В., Евреинов В.В., Энтелис С.Г., "Хроматография в критических условиях и разделение макромолекул по функциональности и топологии", Докл. АН СССР, т.272, №3, с.632-635 (1983).

61. Entelis S.G., Evreinov V.V., Gorshkov A.V., "Functionality and Molecular Weight Distribution of Telechelic Polymers", Adv. In Polymer Science, v.76, p. 129-175 (1986).

62. Snyder, Principles of Adsorption Chromatography, (N.Y.: Dekker, 1968).

63. Snyder L.R., Saunders D.L., "Optimized solvent programming for separations of complex samples by liquid solid adsorption chromatography in columns", J. Chromatogr. Sci., 7(4), pp. 195-208 (1969).