Структурные мотивы в глобулярных белках тема автореферата и диссертации по химии, 02.00.10 ВАК РФ

Ефимов, Александр Васильевич АВТОР
доктора химических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1995 ГОД ЗАЩИТЫ
   
02.00.10 КОД ВАК РФ
Автореферат по химии на тему «Структурные мотивы в глобулярных белках»
 
Автореферат диссертации на тему "Структурные мотивы в глобулярных белках"

РГБ ОД

2 Ь АПР 1995

На правах рукописи УДК 577.150.2

ЕФИМОВ Александр Васильевич

СТРУКТУРНЫЕ МОТИВЫ В ГЛОБУЛЯРНЫХ БЕЛКАХ

02.00.10 - Биоорганическая химия, химия природных и физиологически активных веществ

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора химических наук

Москва - 1995

Рабата выполнена в Институте белка РАН

ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ : доктор химических наук, профессор

В.М.СТЕПАНОВ

доктор химических наук, профессор Э.Г.АРУТЮНЯН

доктор химических наук, профессор А.С.АРСЕНЬЕВ

ВЕДУЩАЯ ОРГАНИЗАЦИЯ: Институт молекулярной биологии

им. В.А.Энгельгардта РАН

Защита состоится года в 16 часов на заседании

диссертационного совета Д 053.05.47 по химическим наукам при Московском Государственном Университете им. М.В.Ломоносова по адресу: 119899, Москва, ГСП-3, В-234, Ленинские горы, МГУ, лабораторный корпус "А" , аудитория 501.

С диссертацией молено ознакомиться в библиотеке Химического факультета МГУ.

Автореферат разослан

■Н ш

&Ï995 года.

Ученый секретарь диссертационного кандидат химических наук

И.Г.Смирнова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Взаимосвязь между аминокислотной последовательностью и пространственной структурой белков остается одной из центральных нерешенных проблем в биоорганической химии и молекулярной биологии. Решение этой проблемы имеет большое значение как для фундаментальной, так и для прикладной науки, поскольку это позволило бы предсказывать пространственные структуры любых белков, целенаправленно исследовать взаимосвязь структуры и функции белков, конструировать новые белки с заданными свойствами, упрощать структуру, сохраняя при этом функцию, белков, имеющих важное значение в биотехнологии и медицине и т. д. Очевидно, что для того, чтобы понять "как" предсказывать пространственную структуру белков, необходимо выяснить "что" предсказывать, т. е. нужно знать все возможные конформации полипептидной цепи и структуры, которые она способна образовать в принципе. С другой стороны, необходимо выяснить, каким образом полипептидная цепь белка из большого числа возможных структур отбирает только одну уникальную структуру, т. е. необходимо знать принципы укладки полипептидной цепи в пространственные структуры.

Целью настоящей работы было решение трех основных задач:

1. Поиск новых, не описанных ранее в литературе, конформации полипептидной цепи как на уровне небольших структур в нерегулярных участках белков, так и на уровне супервторичных структур, образованных двумя и более связанными между собой элементами вторичной структуры.

2. Выяснение необходимых условий образования этих структур, т. е. выяснение необходимых условий, которым должна удовлетворять аминокислотная последовательность, кодирующая ту или другую структуру.

3. Разработка стереохимического метода поиска всех разрешенных пространственных структур глобулярных белков; составной частью этой задачи является выяснение новых закономерностей и принципов укладки полипептидной цепи в пространственные структуры, а также таких свойств цепи, которые резко ограничивают число возможных структур.

Научная новизна. До недавнего времени основное внимание исследователей в данной области науки было сосредоточено на изучении не связанных между собой а-спиралей и(или) /3-участков, на развитии методов их предсказания и выяснении принципов их упаковки; струк-

тура нерегулярных участков при этом сильно упрощалась или не рассматривалась вовсе. Однако, полипептидная цепь белка сворачивается в уникальную структуру как единое целое, и нерегулярные участки играют в этом процессе не менее важную роль, чем а-спирали и (3-структура. Значительная часть настоящей работы посвящена исследованию структуры нерегулярных участков и их роли в отборе уникальных упаковок а-спиралей и(или) /3-тяжей, связанных нерегулярными участками. Обнаружен и охарактеризован ряд неизвестных ранее небольших стандартных структур в нерегулярных участках белков, выяснены необходимые условия их образования. Показано, что основная часть длинных нерегулярных участков представляет собой различные комбинации из двух и более небольших стандартных структур.

В работе описан целый ряд неизвестных ранее структурных мотивов, состоящих из двух и более элементов вторичной структуры и имеющих уникальные укладки полипептидной цепи в пространстве. Показано, что структуры белков, содержащих один и тот же структурный мотив с уникальной укладкой цепи, могут быть получены последовательной пристройкой других а-спиралей и(или) /3-тяжей к этому структурному мотиву, принимая во внимание структурный контекст, хиральность структур, запрет на пересечение перетяжек и из вестные принципы упаковки элементов вторичной структуры. Предложена гипотеза о том, что такие структурные мотивы могут быть зародышами или готовыми "структурными блоками" в процессе сворачивания белков.

Практическая ценность. Полученные результаты значительно расширяют наши знания о конформационных возможностях и свойствах полипептидной цепи как на уровне небольших структур в нерегулярных участках, так и на уровне супервторичных структур. Полученные данные вместе с уже известными конформациями и свойствами полипептидной цепи необходимы для разработки любого (стереохимии еекого, расчетного, статистического) метода предсказания пространственной структуры белков. Они могут использоваться и уже используются при конструировании новых белковых структур, в белковой инженерии, при интерпретации карт электронной плотности в рентгеноструктурнсм анализе белков и при расшифровке пространственных структур белке? методом ЯМР. Предложенный в работе метод описания кокфе;'4' г и << нерегулярных участков широко используется во многих зз>^ . • ных лабораториях.

Апробация работы и публикации. Результаты работы докладывались на рабочих совещаниях "Конформации и функции биологических

молекул" (Юрмала, 1985, 1987, 1989), Всесоюзном рабочем семинаре молодых ученых "Физико-химические свойства биологических макромолекул и методы их исследования" (Пущино, 1985), Всесоюзной школе-семинаре молодых ученых "Стабильность, структура и функции ферментов - теоретические и прикладные аспекты" (Вильнюс, 1986), VII Всесоюзном симпозиуме по химии белков и пептидов (Таллинн, 1987), Научных конференциях Института белка РАН (Пущино, 1988, 1993, 1994), Международном симпозиуме "Методы предсказания бепковык структур, основанные на анализе дальних взаимодействий" (Копенгаген, 1993), а также на семинарах в Колледже Лондонского Университета, в Отделе Кристаллографии Беркбекского Колледжа и в Институте Исследований рака (Лондон, 1992).

Основные результаты диссертационной работы опубликованы в 19-ти научных статьях.

Структура и объем диссертации. Диссертация состоит из семи частей или глав (I. Введение, . . . , VI. Заключение, VII. Основные результаты и выводы) и списка цитированной литературы. Части II, III и IV подразделены на три, восемь и восемь разделов, соответственно. В диссертации нет традиционного обзора литературы в виде отдельной главы, однако большинство разделов содержит введения, где представляется современное состояние соответствующей проблемы, а также описание известных результатов и данных по мере необходимости в тексте. Материал диссертации изложен на 188 страницах, включая 125 страниц машинописного текста, 82 рисунка, 10 таблиц и список литературы, состоящий из 256 наименований.

СОДЕРЖАНИЕ РАБОТЫ I. Введение

Во введении формулируются направление и цели исследования.

II. Небольшие стандартные структуры

В глобулярных белках полипептидная цепь многократно сложена сама на себя и в местах поворотов (обычно это происходит между элементами регулярной вторичной структуры) образует различные нерегулярные, но вполне определенные структуры. Впервые небольшие нерегулярные структуры, состоящие из четырех остатков и обеспечивающие поворот цепи на -180°, были описаны Венкатачаламом в 1968 году ( Venkatachalam, 1958) - это так называемые /3-изгибы типа -I,

II и ill. Впоследствии к /3- изгибам сигали относить практически любой фрагмент нерегулярной структуры из четырех остатков, в котором расстояние между С^-атомами первого и четвертого остатков не превышает 5, 7 A (Crawford et al., 1973) или 7 A (Lewis et al., 1973). Проведенный в настоящей работе анализ, а также анализ, сделанный независимо и одновременно Торнтон и соавт. (Sibanda and Thornton, 1985; Thornton et al., 1988; Sibanda et al., 1989)„ показывают, что в нерегулярных участках белков имеются часто повторяющиеся небольшие стандартные структуры из трех, четырех, пяти и шести остатков.

1. Способ описания конформации нерегулярных участков

В настоящей работе предлагается новый метод описания конформации нерегулярных участков, основанный на распределении экспериментальных значений углов <р, ф на карте Рамачандрана. На рис. 1 показано, что подавляющее большинство точек попадает в шесть

областей "сгущения", обозначенных а, /3, 7, 8, ста..

РИС. 1.

Шесть областей "сгущения" экспериментальных значений углов <р, ф, взятых из белков, структуры которых определены при высоком разрешении (¿2 А).

Такик образок, конформацию каждого остатка полипептидной цепи предлагается обозначать одним из шести символов - а, /3, г» 5, си а^, а конформацию участка цепи записывать, перечисляя конформации остатков от Ы- к С-концу. Несмотря на некоторые недостатки данной номенклатуры (в частности, перекрывание а- и у-областей), она достаточно удобна для описания конформации цепи и в настоящее время широко используется в литературе.

2. Структура стандартных поворотов и переходов

Как показывает анализ, небольшие стандартные структуры можно разделить на два класса в соответствии с их структурной функцией. К первону классу относятся структуры, которые обеспечивают поворот полипептидной цепи на 180°; будем называть их поворотами. Ко второму классу относятся структуры, которые изменяют ход цепи на -90 . Такие структуры часто находятся в местах перехода цепи из одного слоя в другой, поэтому будем называть их переходами ( или полуповоротами).

Среди поворотов наиболее часто в белках встречаются (Зау/З-, /3/3paL/3-, /Зе-у/З-, /За re-, fta^ocjl-, paya^Jl- и fiaaya^fi-повороты. Обычно эти структуры образуют короткие петли в /3-шпилъках, но также встречаются и в длинных нерегулярных участках. /За?/3-Поворот и /З/Зра^/З-поворот - хорошо известные изгибы типа I и II. Структуры других поворотов представлены на рис.2. Как видно, эти структуры компактны и замкнуты в циклы водородными связями.

Рис. 2. Структуры /За. ат /3-, $су@-, (Заус- , /3а?ат/3- и (ЗаауаТ /3-поворо-

_ ^ ^ JL Jj Li LI

тов.

Ко второму классу небольших стандартных структур относятся /За/З-, Ртг/З-, I3C/3-, fiayfi-, £аау/3-, /За/З/З- и /3/3aL/3-переходы, которые изменяют ход цепи на -90°. Эти структуры образуют переходы цепи'из одного слоя в другой, входят в состав длинных петель в виде различных комбинаций между собой или с поворотами, а также образуют /3- выступы (для описания (3- выступов см. Richardson et al., 1978). Структуры полуповоротов или переходов представлены на рис.3. В отличие от поворотов, в этих структурах нет внутрицепо-чечных водородных связей, однако структуры |3а|3(3- и f3|3aTJ3-переходов

замкнуты в циклы Ван-дер-Ваальсовыми контактами между боковыми цепями первого и четвертого остатков. Отметим, что авторы большинства работ по нерегулярным структурам вообще не делают различий между поворотами и переходами (или полуповоротами), хотя, по нашему мнению, эти различия очевидны.

Рис.3. Структуры |3т|3-, |3аг|3-, (За/З/З". /3gaLl3- и /Зе/З-переходов.

Заштрихованные области показывают гидрофобные ядра, а черные кружочки - гидрофобные боковые цепи.

Многие стандартные повороты и переходы имеют один или два остатка в стерически напряженных а- или е-конформациях. Поэтому а^-позиции должны быть заняты глицинами или остатками с гибкими боковыми цепями ( Asn, Asp, Lys, Glu, Gin, ...), которые создают минимальные стерические напряжения в структурах. В е-позициях могут находиться только глицины. Это свойство поворотов и переходов очень важно для кодирования их местоположения в структуре белка. Отметим, что глицины или остатки с гибкими боковыми цепями должны занимать именно те позиции, которые имеют или е-конфор-

мации, а не просто находиться в нерегулярном участке. Другое очень важное для кодирования структуры нерегулярных участков свойство состоит в том, что первые /3-позиции /За ?/3-, /За ус-, .

/Заа^га^/З- поворотов и /Заг/З-, /Згг/3-, (Заат/З-переходов должны быть

заняты гидрофильными или небольшими (Gly, Ala, Pro) остатками. Это правило можно сформулировать в виде запрета: в первых /3-позициях этих поворотов и переходов запрещено находиться массивным гидрофобным остаткам, так как они вызывают дегидратацию свободных NH-групп третьего и(или) четвертого остатков, что очень невыгодно энергетически. В остальных позициях поворотов и переходов, в принципе, могут находиться любые аминокислотные остатки. Эти требования к последовательностям нерегулярных участков можно рассматривать как необходимые условия их образования.

3. Длинные нерегулярные участки в белках как комбинации небольших стандартных структур

Как видно, все небольшие стандартные структуры начинаются и заканчиваются остатками в (3- конформации. Эта особенность определяет, каким образом они должны объединяться между собой в различных комбинациях: соседние стандартные структуры в длинных нерегулярных участках должны соединяться одним или несколькими остатками, имеющими /3-конформации. Как показывает анализ белков, структуры которых определены при высоком разрешении (¿2 Á), по такому принципу устроены практически все длинные нерегулярные участки, и их структура представляет собой различные комбинации из двух или более небольших стандартных структур. Некоторые примеры таких комбинаций из известных белков приведены на рис.4 и 5.

Рис. 4.

Примеры простейших комбинаций из двух стандартных структур, осуществляющих переходы полипептидной цепи из одного слоя в другой. Стандартные структуры выделены квадратными скобками.

РНЕ ASP GLU ASP SER ILE PRO SLft GLY VAL ASP ALA SER LYS ILE SER MET SER GLU GLU ASP 41-61 PLA -92 -74 -67 -88 -138-134 -58 -49 89 -83 -84 -58 -62 -73 -117-121 -73 -66 -51 -86 -81 <p 137 114 -23 -3 43 168 141 127 -6 135 104 -31 -29 -27 -7 164 158 152 -37 -12 141 »

Г~

n

PHE ALA GLY LYS GLN LEU GLU ASP GLY ARG THR LEU SER ASP TYR ASN ILE GLN" LYS GLU SER ß ' '

|_

L

U

VAL VAL ALA GLY GLU PHE ASP GLN GLY SER SER SFR GLU LYS ILE

-103-103-114 62 -106-126-101 -75 -97 -113-109-100 -91 -99 -79

119 119 155 37 152 -57 113 -15 30 142 -12 16 146 88 160

I-1 I-1

В ß ß а. & а 0 а/т Y 3 Y y 3 I_L i I_I

G

66-80 CKYH

TRP LEU ILE PRO ASP SER ALA ASP THR THR ALA THR SEP THR ASN CYS ALA TYR ASP ARG ILE 191-211 DNI*

L_

_J

1_

_J

VAL LYS ALA GLY ASP THR ARG VAL ILE ALA HIS -144-56 -68 69 -74 -88 -72 -113 -7 3 -161-16 5 120 132 133 35 127 -22 -9 118 -41 156 154

В

n

UBQ

73-83

Рис.5. Комбинации стандартных структур в длинных нерегулярных участках пластоцианина (РЬА), убиквитина (ИБО), химотрип-сина (СНУМ), дезоксирибонуклеазы I (ОИ1) и азурина (АгЫ). Небольшие стандартные структуры выделены квадратными скобками.

III. Стандартные структуры, образованные двумя связанными элементами вторичной структуры

В данной работе стандартными структурами одного типа считаются такие структуры, полипептидные остовы которых практически совпадают при наложении друг на друга; они могут различаться длинами а-спиралей и(или) /3-тяжей, но должны иметь одинаковую длину и конформацию перетяжек. В этой части работы проведен стереохимический анализ таких стандартных структур, рассмотрены условия их образования и проведено сравнение теоретически полученных результатов с экспериментальными данными.

I. Стереохимический анализ а-спиралей и ß-тяжей, упакованных на гидрофобной поверхности

Один из основных принципов строения белковых молекул состоит в том, что их полипептидные цепи должны сворачиваться так, чтобы • •образовать гидрофобное ядро и полярную оболочку; боковые цепи остатков, находящихся в гидрофобном ядре, должны быть гидрофобными; гидрофильная боковая цепь или другая полярная группа могут

находиться в гидрофобном окружении только в том случае, если они имеют партнеров для образования водородных или солевых связей (Perutz et al., 1965; Lee and Richards, 1971; Chothia, 1974; Lim, 1974).

На рис.6 показано поперечное сечение двух и трех а-спиралей, плотно упакованных на гидрофобной поверхности антипараллельно (или параллельно) друг к другу. Как видно, полностью утопленными в гидрофобном ядре оказываются один или два остатка на виток каждой a-спирали. В соответствии с упомянутым выше принципом, эти остатки

Рис. 6.

Поперечное сечение двух или трех а-спиралей, упакованных на гидрофобной поверхности. Черными шарами показаны боковые цепи, полностью утопленные в гидрофобном ядре, наполовину черными - частично утопленные и белыми - доступные растворителю.

должны быть гидрофобными. Частично утопленные в гидрофобном окружении остатки могут быть как гидрофильными, так и гидрофобными, но предпочтительно - гидрофобными. Доступные растворителю остатки предпочтительно должны быть гидрофильными. Таким образом, каждая а-спираль должна иметь по крайней мере один гидрофобный остаток на виток. Эти остатки должны располагаться в аминокислотной последовательности так, чтобы образовать на поверхности а-спи-рали непрерывную гидрофобную полосу, так называемый необходимый гидрофобный кластер, например, они могут занимать позиции 1-5-9-12-16. . . . 1-5-8-12-15. . . , 1-5-9-13.

В идеальных случаях /3-тяжи должны иметь строгое чередование

(Ь>

I»)

Рис. 7. Доступность боковых цепей /3-тяжей, упакованных на гидрофобные поверхности (заштрихованные области). а) Вид /3-листа с торца; Ь) вид /3-тяжа сбоку; с) /3-тяж, расположенный между двумя гидрофобными поверхностями, обозначения боковых цепей такие же, как на рис. 6.

вдоль цепи гидрофобных и гидрофильных остатков (Lim, 1974; см. рис. 7Ь). Следует, однако, иметь в виду, что это справедливо только для центральных /3-тяжей р-листа (рис. 7а), поскольку боковые цепи крайних ß-тяжей частично утоплены в гидрофобное ядро и, следовательно, могут быть гидрофильными. Если ß-тяж находится между двумя гидрофобными ядрами (рис.7с), то он должен состоять только из гидрофобных остатков.

2. Стандартные конформации полипептидной цепи на Н- и С-концах а-спиралей

Путем стереохимического анализа с помощью молекулярных моделей, а также в результате анализа громадного экспериментального материала по структурам известных белков установлено, что полипептидная цепь принимает ограниченный набор стерически разрешенных конфорнаций на N- и С-концах а-спиралей. Полипептидная цепь может "входить" в a-спираль на N-конце и "выходить" из нее на С-конце приблизительно перпендикулярно или параллельно ее оси. В случае перпендикулярного "входа" стерически разрешенной является ßa^-кон-формация цепи (в частности, Ррос^-конформация), где п - число остатков в a-спирали. В случае параллельного "входа" стерически разрешенной является руод-конформация или близкая к ней Sa/ian-конформация. При параллельном "выходе" из a-спирали полипептидная цепь имеет ап7Р~ ипи близкую к ней о[пг5-конфорнацию. Наиболее распространенной конформацией цепи при перпендикулярном "выходе" является апто^р-конформация, но встречаются также разрешенные a rßocTß-, a re-конформации и очень редко - стерически напряженная

П Li П

а р-конформация.

В случае перпендикулярного "входа", имеющего /Зосп-конформацию,

ß-остаток должен быть гидрофильным или небольшим (Gly, Ala, Pro).

Массивным гидрофобным остаткам запрещено занимать эту ß-позицию,

поскольку они вызывают дегидратацию свободных NH-групп третьего

и(или) четвертого остатков a-спирали. В случае параллельного

"входа" с ß7<*n~ или Sa/уо^-конформацией боковая цепь ß- или S-

остатка удалена от свободных NH-групп на торце а-спирали и поэтому

может быть гидрофобной, но предпочтительно должна быть также

гидрофильной или небольшой. В кодировании С-концов а-спиралей

особую роль играют остатки глицинов (впервые эта роль глицинов

была отмечена в работе Schellman, 1980). Проведенный нами анализ

показал, что ат-позиции в перпендикулярных "выходах" с a ra.ß-

J-> П L

конформацией должны быть заняты глицинами или гидрофильными

остатками с гибкими боковыми цепяни, а в перпендикулярных

"выходах" с «пуе-конформацией е-позиции должны быть заняты только

глицинами. В случав параллельных "выходов" с или апгЗ-кон-

формацияни никаких стерических ограничений нет, и р- или 5-позиции могут быть заняты любыми остаткани.

3. Структура стандартных а-а-шпилек с короткими перетяжками

а-а-Шпилька - это супериторичная структура из двух соседних по цепи а-спиралей, которые связаны перетяжкой и упакованы анти-параллельно. ос-а-Шпильки с короткими перетяжками представляют особый интерес, поскольку короткие перетяжки из одной-трех пептидных единиц имеют ограниченное число стерически разрешенных конформаций и, следовательно, имеется ограниченное число стандартных а-а-шпилек с короткими перетяжками. Как показывает анализ, кратчайшую перетяжку имеет а-а-шпилька с атгсап~конформацией, где шип- число остатков в первой и второй а-спиралях, соответственно. Эта структура разрешена только а том случае, если с-позиция занята глицином. Расположив а-а-шпильку на гидрофобной поверхности, можно легко выяснить, какие остатки полностью спрятаны в гидрофобном ядре и должны быть гидрофобными. В принципе, возможны два случая: а-а-шпилька может быть правой и левой в зависимости от того, как расположена вторая а-спираль относительно первой справа или слева, если смотреть с одной и той же стороны (мы будем рассматривать их всегда со стороны гидрофобного ядра). Результаты такого анализа представлены на рис.8а, откуда видно, что левые и правые а-а-шпильки должны иметь различное расположение вдоль цепи гидрофобных, гидрофильных и глициновых остатков.

При объединении перпендикулярного "выхода" с о^го^/З-конфор-мацией первой а-спирали и перпендикулярного "входа" с /За^-конфор-мацией второй а-спирали образуется стандартная а-а-шпилька с а^а^а^конформацией, показанная на рис. 9. Если на эту шпильку смотреть сверху (гидрофобное ядро - сверху), то она будет правой; для нее черными шарами показаны те остатки, которые полностью будут спрятаны в гидрофобном ядре и должны быть гидрофобными. Если смотреть снизу (если гидрофобное ядро - снизу), то эта шпилька будет левой; заштрихованными шарами показаны остатки, которые должны быть гидрофобными в левой шпильке. Идеальные последовательности этих и других а-а-шпилек с короткими перетяжками показаны на рис.8. Проведенное в работе сравнение идеальных последовательностей а-а-шпилек, полученных путем априорного стереохимического анализа, и последовательностей соответствующих а-а-шпилек из белков с известными структурами показывает хорошее совпадение

союсхжхжоэтпэшюоюссвсошзж) соо*со*оосвосо*зсшх*сосжххжх»

ООСЗЮОСЖЭСЖХХЖХЗФ©ШОвСХХЖХ»ССХЖ)

тххжххжхжххжх&шхжххясовсоо

С)

«•■«■•■. latí «L |р <«

сжхжхх*оо»© •®оэ*оосжх»ах*э оважххжх© • ® оссвсажхжхх»

aaaaa«iaaaaaj00

(жххжсффсстжжсоюошхтээ

аааааааааа«аа«ат8т0аааааааааагааааа

сажхжххжхжосхжххжххжхжхх»

Рис.8. Конформации остатков и идеальные последовательности а-а-

шпилек с короткими перетяжками. Черными кружочками показаны гидрофобные остатки, белыми - гидрофильные; буквами G отмечены позиции глицинов или остатков с гибкими боковыми цепями, крестиками - остатки, которые должны быть гидрофильными или небольшими (Gly, Ala, Pro). В случаях а), Ь) и с) верхние цепочки из кружочков соответствуют правым, а нижние - левым а-а-шпилъкам; в случае d) показана цепочка для правой, а в случае е) - для левой а-а-шпилек.

результатов теории с экспериментом. Таким образом, каждая стандартная а-а-шпилька должна иметь строго определенное и свойственное только ей расположение в цепи гидрофобных, гидрофильных и глициновых остатков, которое можно представить в виде цепочки из черных и белых шаров. Полученные идеальные последовательности можно использовать не только для предсказания а-спиральных участков, образующих а-а-шпильки, но и для предсказания взаимного расположения о-спиралей (т.е. можно выяснить, уложатся они в правую или левую шпильку), если перетяжки - короткие.

Рис. 9.

Структура а-а-шпильки с а ?а ра -конформацией.

ш L п

4. Структура а-а-уголков

а-а-Уголок - это супервторичная структура, образованная двумя соседними по цепи ос-спиралями, которые связаны перетяжками и упакованы крестообразно. Первоначально структуры такого типа привлекли внимание исследователей из-за их функциональной роли; примером могут служить "E-F-спирали", связывающие ионы кальция (Kretsinger and Nockolds, 1973), и структурные мотивы типа "спираль-изгиб-спираль", взаимодействующие с двойными спиралями ДНК (McKay and Steitz, 1981; Beamer and Pabo, 1992). Нами было показано, что а-а-уголки широко распространены как в гомологичных, так и в негомологичных белках, а их последовательности имеют строго определенное расположение в цепи гидрофобных, гидрофильных и глициновых остатков. Структура а-а-уголка с короткой перетяжкой и его идеальная последовательность в виде цепочки из черных и белых шаров показаны на рис. 10. В работе на большом количестве

свосаосв®ос®з*®оос«ос»*ооовооо

примеров из белков с известными структурами показано, что такое же расположение в цепи гидрофобных, гидрофильных и глициновых остатков имеют практически все найденные а-а-уголки с короткими перетяжками. независимо от того, в гомологичных или негомологичных белках они встречаются. Это позволяет с высокой степенью достоверности предсказывать такие а-а-уголки в белках с неизвестной структурой. Другая замечательная особенность а-а-уголков состоит в тон, что в белках они существуют только в одной из двух возможных "зеркально-симметричных" форм (в той, что показана на рис.10), т.е. взаимное расположение в пространстве а-спиралей в а-а-уголках всегда приблизительно одинаково, независимо от длины и конформации

Схематическое изображение а-а-уголка с короткой перетяжкой (а), его конформация и идеальная последовательность (Ь).

Рис. 10.

перетяжек. В соответствующем разделе ниже будет показано, что это свойство а-а-уголков резко сокращает число возможных упаковок а-спиралей в белках, содержащих а-а-уголки.

5. L-Образные структуры

Если объединить параллельный a^yß/5-выход из одной а-спирали и перпендикулярный (Зап~вход в другую а-спираль, получится L-образ-ная структура с аттЭ/5«п-конформацией. Особую роль в образовании таких структур играет пролин. С одной стороны, он способствует образованию излома между двумя а-спиралями, с другой стороны, он предпочитает находиться в строго определенной позиции L-структуры, а именно в следующей после остатка с Э/5-конформацией позиции. Как показывают расчеты (Schimmel and Flory, 1968) и статистический анализ белков (Mac Arthur and Thornton, 1991), для пролина вообще энергетически выгодно иметь предшествующий ему остаток в ß-конфор-мации или близкой к ней (т.е. не только в L-структурах).

L-Образные структуры могут быть правыми или левыми в зависимости от взаимного расположения а-спиралей и гидрофобного ядра. В работе проведен стереохимический анализ таких L-структур и показано, что правые и левые L-структуры должны иметь различное расположение в цепи гидрофобных, гидрофильных и пролиновых остатков. Характерной особенностью L-образных структур, содержащих остатки пролинов, является то, что они часто входят в состав а-а-шпилек, а-а-уголков, a-ß-дуг. В таких случаях вторая а-спираль L-структур бывает, как правило, короткой (около одного витка). В работе дано подробное описание таких структур, проведен их стерео-химический анализ, и на большом количестве примеров из белков с известными структурами показано хорошее совпадение результатов теории и эксперимента.

6. Двухспиральные V-образные структуры с amißßpan-KOH<pop>tatfuev

V-Образные структуры из двух связанных a-спиралей, с одной стороны, похожи на a-a-шпильки, у которых сильно удалены друг от друга несвязанные концы а-спиралей, а, с другой стороны, похожи на L-образные структуры. В V-образных структурах a-спирали имеют длину, как правило, не превышающую трех-четырех витков, а взаимодействуют они между собой, в основном, двумя-тремя витками, ближайшими к перетяжке. В качестве примера в диссертации рассмотрена наиболее распространенная в белках V-образная структура с a ißß а -конформацией. На рис. 11 показано сравнение результатов

аааааааааг0 0рааааааааааааааа

А х©к p(VXX>D s©o A V R'jñc A©©» M0P Q® 82*106 T4 LYSOZYME

е н Q®K s©p Q T T&E H©®* L&E K©v 38-64 UTEROGLOBIN

В в S©L t(l)©t S (Ris N A Q(*'Q Е©фА A© К T©F 35-61

в к V©T еф© A s Ф* P В e(L)R A©&Q V©B 107-133 ANNEXIN

в в к© I t©©q T'VR»S V s h<l)r K©©D К ©H T©S 191-317

V Y в©* Q©®I ифо D R D©I R©©* Y© 348-270 TYR RS

R 3 N0A Y©£«E r(k)n В G В ©V *©©ï vCi'v I(H» 100-125 HQfOC Y AN IК *

I т R(G)S Nv'S(L)K A©P V E bfR'Q 82-105 TRP REPRESSOR*

в * ФА X H V©D 8-36 6. OXIDASE

сожсмсст® oooeoceeoctcceo

Рис. 11. Сопоставление аминокислотных последовательностей, кодирующих V-образные структуры с ат rßß рап-конформацией в белках, с идеальной последовательностью, полученной путем стереохимического анализа. Крестиком показана /3-позиция в начале второй спирали, которая должна быть занята гидрофильным или небольшим остатком.

стереохимического анализа (цепочка из черных и белых шаров) и найденных в белках V-образных структур с такой конформацией. В каждом столбце расположены структурно-эквивалентные остатки, конформации которых показаны соответствующими символами в верхней строке. Кружочками обведены остатки, которые должны быть гидрофобными в идеальном случае, и большинство из них гидрофобны в белковых структурах, хотя некоторые позиции заняты гидрофильными остатками (они обведены пунктиром). Эти отклонения легко объяснимы и допустимы в белках, поскольку остатки Thr и Ser всегда находят партнеров для образования водородных связей и могут находиться, поэтому, в гидрофобном окружении, а остатки Arg, Lys и Glu имеют длинные гидрофобные "ножки", которые, с одной стороны, взаимодействуют с гидрофобным ядром, а с другой стороны, позволяют вывести полярные "головки" из гидрофобного окружения.

7. ß-ß-Шпилъки и ß-ß-дуги с короткими перетяжками

В /3-(3-шпильках /3-тяжи располагаются в одном слое антипарал-лельно друг другу и образуют водородные связи. В ß-ß-дугах ß-тяжи расположены также антипараллельно, но в разных слоях и водородных связей не образуют, а взаимодействуют только боковыми цепями. /3-/3-Шпильки могут быть правыми и левыми в зависимости от того, второй /3-тяж располагается справа или слева относительно первого, если смотреть с одной и той же стороны (со стороны гидрофобного ядра). В литературе описано несколько классификаций ß-ß-шпилек, основанных на различиях и сходстве длины и конформации перетяжек, а также

системы водородных связей (Sibanda and Thornton, 1985; Milner-White and Poet, 1986; Sibanda et al., 1989). В данной работе /3-/3-шпильки подразделяются на несколько стандартных типов, где к каждому типу относятся одинаковые структуры, совпадающие при наложении и конформация которых описывается одинаковой формулой.

Стереохимический анализ стандартных /3-/3-шпилек может быть проведен аналогично анализу двухспиральных структур. На рис. 12 представлены структуры и результаты анализа правых и левых /3-/3-шпилек со стандартным (Затга^р-поворотом. Гидрофобные боковые цепи показаны черными шарами, гидрофильные - белыми, а^-позиция должна

(а)

Правая (а) и левая (Ь) /3-/3-шпильки со стандартным paya L 0-поворотом

(предполагается, что ядра находятся сверху).

гидрофобные

быть занята глицином или гидрофильным остатком с гибкой боковой цепью, первая /3-позиция поворота, помеченная крестиком, должна быть занята гидрофильным или небольшим остатком. Аналогично проведен анализ других стандартных /3-/3-шпилек. Их конформации и идеальные последовательности представлены на рис. 13. Проведенное в работе сравнение с экспериментальными данными подтверждает результаты стереохимического анализа, а наблюдаемые отклонения легко объяснимы и не противоречат основным принципам.

На рис. 14 показана структура £"/3"дуги с минимальной перетяжкой, имеющей Э/ЗрЭрО^/З-конформацию. Обозначения такие же как на предыдущих рисунках. Примеры таких /3-/3-дуг из белков с известными структурами подтверждают результаты стереохимического анализа.

8. Стандартные а-р- и (З-а-дуги с короткими перетяжками

а-/3-Дуги и /З-а-дуги - это структуры, в которых соседние по цепи и связанные между собой а-спирали и /3-тяжи упакованы приблизительно антипараллельно в двух разных слоях. Они широко распространены в а/£-белках и, как правило, входят в состав так называемых "укладок по Россману". В диссертации рассмотрен целый ряд таких структур, в которых длина перетяжек не превышает 5-6 амино-

M»Í»M ß'ß «L e'f MtlMt

eo©coc©co© © ес®о@с@з®

O®O0C®D®O© © СЖЖЖЖ5

(Hí(»l '/! ßp oL s'e мм»

0©0©Э©0©0©©0©0©С@ ©С@С®Э®СО© O®C@C0O

МММ eTTTlPß м м и

о®с®свс®юесвс®о® ©О0СЖЖЖХЖЖЖ5

мм« ß'ß « r «L e's мм*

©0®Q@O8CO© OC0C0O®

c®c©c®soo© oeoeoeo

ß ß ß ß ß ßlß а а Г «L е'э MMß

«жжжхюэвовово®

О0СЖ»ЮСС©СвСвО0О

Рис. 13.

Конформации и идеальные последовательности стандартных /3-/3-шпилек с короткими перетяжками. Верхние цепочки из шаров соответствуют правым, нижние -левым /3-/3-шпилькам в каждом случае ( а-е).

Рис. 14.

Стандартная ß-ß-цуга. с /3mßp/3paL/3n-KOH-формацией. Заштрихованная область гидрофобное ядро.

кислотных остатков. Здесь мы ограничимся анализом только двух структур и проведем сравнение результатов стереохимического анализа с экспериментальными данными; результаты по структурам других a-ß- и ß-a-дуг во многом аналогичны.

На рис. 15 представлена структура a-ß-дуги с кратчайшей перетяжкой; она может быть получена непосредственным присоединением /3-тяжа к стандартному "выходу" из a-спирали с а^а^/З-конформацией. Предполагается, что гидрофобное ядро находится между а-спиралью и ß-тяжем. На рис. 16 приведены результаты сравнения идеальной последовательности и последовательностей таких a-ß-дуг из белков с известными структурами. Видно, что в большинстве случаев аппозиции заняты глицинами. Некоторые позиции, которые должны быть заняты гидрофобными остатками в идеальном случае, заняты остатками Thr, Ser, Arg, Lys, но, как уже отмечалось выше, это допустимо.

Стандартная а-/3-дуга, имеющая а га, (30 -конформацию. го ь п

Рис. 15

1Ь *******

х м0в ь©а х с©: в ф в 'Л* 0 © К А1 X 14-14 1

к и® Я В ©В В К® и б © С ©У©У В »4-112/ ГЬАУОООХМ

с х©т о©* х 1©<г к © С ©тСна в 20-Эв АООПНЛТВ К1НА5В

А ©А А(ЬХХ»8 1. © в фв©х©с 232-241 САЯВОХУР ВРТХОАв В

А А ©К А®У 0 Х®У А (5» с ©У©У®А 135-152 Бивпывш

о в®в а (Г) к к а©в В ® С ® в©в©к 101-120* Ь7/Ь12

в С©Ь лфл В «®а В © С ®И®А©У В 30-50* 1

К©Н А 1©0 N И©Т К ф и ©и©1 К 109-1274 ■ СШТАТНЮКВ 1Ш1иСТА5Е

Ь©8 А©У А X®* С © в ®Х©1®У 70-18 АВААХМОв В-В1К01ИС Р((ОТЕ1Н

Р И©Ь X. > в фт®Х©А© 303-31« АЮОНОЬ ОВНХОКОСЕКАВВ

рС€®1 с®т * (т» с ©I®!© 22-36 СЯАМВ1М

схжхжэоовоо с © эсжжж

Рис 16. Сравнение идеальной и реальных аминокислотных последовательностей, кодирующих а-р- дуги с %ГаьРРп- конформацией.

На рис.17 показана структура и результаты стереохимического анализа стандартной (3-а-дуги. с РтРг(Зап-конформацией. а на рис. 18 -сравнение с экспериментальными данными.

В целом наблюдается

Рис. 17.

Структура стандартной /З-а-дуги с /З^/ЗоТ—конформацией. •

ß ß ß ß ß ß'ß а/г a/r a a a a a a a a

Е©А©уф V К E D X©K G E©M 49-64 LOH

тфс © p s 1 V©R;s n(f)n V 1-15 CRA

;N;N(F) к s А В D©M R T©G 43-56 PTI

фт© s N К С N©C К A©V 29-42* OKJPQ3

©i®*®V© s N E С E (м)м A H© 91-107* SSI

в v©k©a© p 0 G E Кфь N A©0 34-51 1 ABP

®L®V(G) M N D S T©L G G©R 199—214 J

a©v© H D V A A©P A Y0K 73-87* DFRLC

G©T© s N E С V©C s e(n»k 326-342* PSTI

*©T©Q© I S G T G(S»L R V©A 100-116*1

©A(F)T ©I© R D А E Е0Х r©E)S 268-285*/ AAT

эсжж» О ® о ООКХХЖ)

Рис.18. Сопоставление аминокислотных последовательностей, кодирующих ß-a-дуги с ßmßnßa - или ßaßa^-конформациями, из лактатдегидрогеназы (LDH), крамоина (CRA), трипсинового ингибитора (PTI), овомукоида (0MJPQ3), ингибитора субти-лизина (SSI), белка, связывающего арабинозу (АВР), дигидрофолатредуктазы (DFRLC), секреторного ингибитора трипсина (PSTI) и аспартатаминотрансферазы (ААТ).

хорошее совпадение идеальной и реальных последовательностей, а имеющиеся отклонения объяснимы доступностью боковых цепей молекулам воды (сравните с рис.В и 7) в реальных структурах.

В заключение этой части работы отметим следующее:

1. Для каждого типа структур, образованных двумя а-спиралями, двумя /З-тяжами или a-спиралью и ß-тяжем, связанными короткими перетяжками, стерически разрешен ограниченный набор стандартных конформаций. Именно стерически разрешенные стандартные структуры наиболее часто встречаются в белках.

2. Каждая стандартная структура должна иметь строго определенное и свойственное только ей расположение в цепи гидрофобных, гидрофильных, глициновых и(или) пролиновых остатков. В этом требовании к аминокислотным последовательностям заключаются необходимые условия образования той или иной стандартной структуры.

3. Многочисленные примеры из белков, структуры которых определены при высоком разрешении, показывают, что результаты априорного стереохимического анализа хорошо согласуются с экспериментальными данными. Наблюдаемые несовпадения легко объяснимы, если принимать во внимание реальное белковое окружение той или иной структуры.

IV. Структурные мотивы в глобулярных белках

В последнее время структурными мотивами принято считать структурные единицы, образованные двумя, тремя и более соседними по цепи и связанными между собой а-спиралями и(или) р-тяжами, которые часто встречаются в различных белках или многократно повторяются в одном и том же белке. Среди множества возможных и наблюдаемых в белках структурных мотивов (простые мотивы из двух элементов вторичной структуры рассмотрены в предыдущих разделах) только их небольшая часть имеет уникальные укладки полипептидной цепи в пространстве и существует только в одной из двух "зеркально-симметричных" форм. Впервые структурные мотивы с уникальной укладкой цепи . были обнаружены в нескольких а/&- белках Рао и Россманном (Rao and Rossmann, 1973) - это так называемые /3-а-/3-а-/3-единицы (рис. 19Ь). Анализ громадного экспериментального материала показал, что р-а-р- и 0-а-/3-а-0-единицы (рис. 19а, Ь) существуют в белках практически всегда в одной из двух форм - в форме правой суперспирали (Sternberg and Thornton, 1976). На рисунках 19 и 20 показан ряд других структурных мотивов, имеющих уникальные укладки цепи и существующих в одной из двух "зеркально-симметричных" форм. Правая суперспираль из р-тяжей (рис.20е) была найдена в нескольких /3-белках и описана в работе Ричардсон (Richardson, 1981); "ОВ-фолд" (рис. 20h) обнаружен в ряде белков, связывающих олиго-нуклеотиды или олигосахариды (Murzin, 1993); правая суперспираль из а-спиралей, фрагмент которой показан на рис.20i, была впервые найдена в липовителлине (Raag et al., 1988); другие структурные мотивы, представленные на рис.19 и 20, обнаружены и охарактеризованы автором настоящей работы и будут подробно рассмотрены ниже.

1. Структурные мотивы иэ четырех агспиралей, упакованных в пучки

Пучки из четырех а-спиралей довольно широко распространены в глобулярных белках, однако, встречаются в нескольких вариантах, которые различаются упаковками а-спиралей и ходом полипептидной цепи в пространстве. Впервые два "зеркально-симметричных" варианта четырехспиральных пучков, названных типами I и II, были рассмотрены Аргосом и соавт. (Argos et al., 1977). Схематически упаковку а-спиралей в пучках типа I и II можно представить следующим образом:

C-D D-C

тип I I || тип II

В-А А-В

Л)

РИС. 19.

Структурные мотивы, имеющие уникальные укладки цепи и существующие в белках только в одной из двух "зеркально-симметричных" форм. Стрелками показаны /3-тяжи, цилиндрами - а-спирали.

X

аа-согпег сЫМ ЭМшгр'п

<

4

0,

РР-СОПХГ

Р$Э-<ирегЬеКж

аБа-зирегЬе1(х

ЩГ чд

РИС. 20.

Примеры более

сложных структурных мотивов с уникальными укладками а-спиралей (показаны в виде цилиндров) и )3-тяжей (показаны в виде стрелок).

Первоначально считалось, что пучки типа I энергетически выгоднее, чем тип II, поскольку они чаще встречались в белках, однако, позднее анализ большего количества белков показал, что они встречаются приблизительно равновероятно. Еще несколько вариантов четырехспиральных пучков, в которых одна или две длинные перетяжки проходят по поверхности структуры с одного торца пучка на другой, были описаны Преснеллон и Козном (Presnell and Cohen, 1989). Отметим, что в пучках типа I и II все перетяжки находятся на торцах. Правую суперспираль, представленную на рис.20i, также можно рассматривать как четырехспиральный пучок. Несмотря на относительную простоту структуры пучков, вопрос о том, как и почему конкретный белок сворачивается в ту или другую структуру, до конца не ясен, однако, если а-спирали связаны короткими перетяжками, ответ на него может быть получен.

В пучке типа I пары спиралей А и В, а также с и D образуют левые а-а-шпильки, а пара В и С образует правую а-а-шпильку, если смотреть со стороны гидрофобного ядра. Как было показано выше, левые и правые а-а-шпильки с короткими перетяжками кодируются различными последовательностями, и их структуры могут быть предсказаны. Таким образом, если шпильки А-В и C-D - левые, то должна образоваться структура типа I. Пучок типа I должен образоваться также, если шпилька А-В - левая, а В-С - правая, или если шпилька В-С - правая, а шпилька C-D - левая одновременно. Аналогично можно выяснить условия образования пучка типа II, принимая во внимание, что здесь шпильки А-В и C-D должны быть правыми, а шпилька В-С -левой. Структура, показанная на рис.20i, также может быть предсказана в случае коротких перетяжек, принимая во внимание тот факт, что в ней шпилька А-В должна быть левой, a C-D - правой.

2. Структурные мотивы в белках с ортогональной упаковкой а-спиралей

Практически во всех белках с ортогональной (или крестообразной) упаковкой а-спиралей имеется структурный мотив из двух а-спиралей, названный а-а-уголком (рис.19g). Многие белки этого класса содержат трехспиральные мотивы типа уголок-уголок, шпилька-уголок, уголок-шпилька или левую суперспираль типа уголок-уголок (см. рис. 20j-l и рис.21). Проведенный нами анализ показал, что практически все известные структуры а-белков этого класса могут быть получены последовательной пристройкой а-спиралей к а-а-уголку, принимая во внимание следующие правила и запреты:

1) а-а-уголок должен быть только в одной из двух "зеркально-

симметричных" форм (рис. 19g и 21);

2) пересечение перетяжек запрещено (Лим и соавт., 1978);

3) а-спирали должны упаковываться в компактные структуры в соответствии с известными принципами упаковки; в грубом приближении это достигается, если а-спирали упакованы приблизительно антипараллельно, параллельно или ортогонально относительно друг друга (Crick, 1953; Chothia et al., 1977; Ефимов, 1977).

Первые шаги такого роста структур, начиная с а-а-уголка, показаны на рис. 21.

■ ^ A-Repressor (8-53) В" 434 cro-Protein (1-371 434-Repressor (1-37)

17V GK"J HNF-3

CAP

Globins [E. F. G, Hi CoMcin A It, 7, 8. 9) Diphtheria Toxin (240-3781 N Anneiin (35-86, 106-15*1

Hairpin-Corner-Hairpin

Thermoiysine (224-314) Citrate Synthase (88-195)

Э" Papain (24 Corner-Corner-Hairpin Zn* . G-Peptidase (14-781 Endochitinase Comer-Corner Superhelix

Рис.21. Схема последовательной пристройки а-спиралей к а-а-уголку.

Справа от каждой структуры перечислены примеры белков, где она встречается.

Аналогично проведен анализ возможных вариантов упаковок при добавлении пятой, шестой и т.д. а-спиралей, а также 0-тяжей. Отметим, что представленная на рис. 21 схема является схемой поиска возможных структур белков данного класса, а не предсказанием пространственных структур, поскольку мы брали а-спирали и другие участки в виде готовых "блоков" и не принимали во внимание информацию, заложенную в их первичных структурах.

3. Структурные мотивы в а/р-белках

В соответствии со структурной классификацией белков (Levitt and Chothia, 1976), к классу а/р-белков относятся белки, образованные чередующимися вдоль цепи а-спиралями и /3-тяжами. Их можно подразделить на три подкласса - это так называемые а//3-цилиндры, трехслойные а//3-белки и двухслойные а/р-белки. Основными структурными мотивами а/0-цилиндров являются правые р-а-р- и с£-а-13-суперспирали (рис. 19а, Ъ). Эти же структурные мотивы повторяются многократно в трехслойных а/(3-белках. Наки было показано, что в трехслойных a/Э-белках имеются более сложные структурные мотивы из пяти и семи элементов вторичной структуры (рис. 20а, Ь), а в двухслойных а/р-белках всегда имеется abc/ad-структура (рис.I9f) или ее варианты ( см. , например, рис. 20с, d).

abca/d-Структура может быть взята в качестве стартовой структуры, последовательным добавлением к которой а-спиралей и р-тяжей можно получить структуры всех известных двухслойных а/р-белков (рис.22), принимая во внимание три основных правила:

¿-Efqbig ^ o-otf^is ¡Se^bfa

(?) d. ® \d, d, cAPK / d, MAP (7-115,

Rubisco S (20-1201 ^ / .<«■>.■.

d, MAP (7-115, 119-242)

dab ® ® \ Rubisco L (30-1401 в 110-1001

PCMH

d, a,

"i »1 CMIF R (10-1001

\ ® di ® ga, ® HPr

• С d «'»С'

d d, a b d, d a, a b Protein G RNase H Ubiquitin Hexokinase (tO-HOl K|c'now ,ragm U27.4J0)

d a, a b a, l', b' a* a', d'

a'j d a, a, « ь a'

TATAbox BP 121-1231

Рис.22. Схема последовательной пристройки а-спиралей и р-тяжей к аЬс/(^-структуре. Все структуры показаны так, как они выглядят с торцов; а-спирали показаны кружочками, /3-тяжи -квадратиками; ближние к наблюдателю перетяжки показаны двойными линиями, удаленные - одиночными.

1) а-спирали должны упаковываться в а-спиральный слой, а /3-тяжи - в /3-слой растущей структуры; а-спирали и /3-тяжи не могут упаковываться в одном слое, так как это приводит к дегидратации свободных NH- и СО-групп £-тяжей, что запрещено;

2) пересечение перетяжек запрещено {Лим и соавт., 1978);

3) /3-а-/3-единицы должны укладываться в правые суперспирали как в стартовых abc/ad-структурах, так и в любой растущей структуре ( см. рис. 19а, b, f).

4. Сходство пространственных структур двухслойных а/13- и /3-белков

Сравнительный анализ различных белковых молекул является простым и очень результативным методом получения информации, необходимой для выяснения и понимания принципов укладки полипептидных цепей в пространственные структуры. Особое значение имеет сравнение структур негомологичных белков, поскольку сходство их структур указывает на то, что в основе этого сходства лежат общие физико-химические принципы укладки полипептидных цепей, а не эволюционная дивергенция или функциональная конвергенция белков. В литературе описан ряд случаев сходства структур неродственных белков, принадлежащих к одному структурному классу (см., например, Richardson, 1977/ 1981; Ptitsyn and Finkelstein, 1980; а также рис.21-23). В настоящей работе впервые продемонстрировано сходство пространственных структур белков, принадлежащих к различным структурным классам.

Как показывает анализ, двухслойные ос//3- белки и /3- белки с параллельной упаковкой /3"слоев имеют много общего. Прежде всего, эти белки похожи тем, что в каждом белке этих классов имеется, по существу, один и тот же структурный мотив, т.е. abc/ad-структура в сс//3-белках (рис. I9f) и abed-структура в /3-белках (рис. 19с, d), которые имеют одинаковые укладки цепи в пространстве, но отличаются конформациями с-участков. В белках обоих классов abed-структуры всегда расположены на краях двойных слоев, а остальные а-спирали и(или) /3-тяжи всегда упакованы с одной и той же стороны abed-структуры, а именно той стороны, где находится тяж d. Схемы на рис.22 и 23 показывают, что структуры двухслойных а/3- и /3-белков могут быть получены последовательной пристройкой других участков к abcd-етруктурам, принимая во внимание практически одинаковые правила (см. предыдущий раздел). Для лучшего сравнения сходные структуры на рис.22 и 23 расположены одинаково и пронумерованы одинаковыми цифрами в кружочках (за исключением структур 6,

которые различаются). Как видно,* структуры 1 на обоих рисунках имеют одинаковые укладки цепи в пространстве и отличаются только конформациями с-участков. Структуры 2 отличаются только конформа-циями участков с и а^, структуры 7 - конформациями участков с, а1 и и т. д. Таким образом, не только в белках одного структурного класса, но и в белках, принадлежащих различным классам, полипептидная цепь укладывается в соответствии с одними и теми же принципами.

0 d, di SOD

Immuno globulini

жд ЧЧЧ /^ЦЛА

и р-н нм шз фн¥в

© d> d- TBSV [Pi

ф

d, d,

Л ЯД -^Э-Н-ЧА ^^ ^АД

М5на 6-Е/ЕНЗ -В-етн-® -в-етЬ-а Й-EIMI

di Prealbumin

J'-Crystallin domain*

d а, ■ ь а, АР 1273-355)

d, d а, а ь

АР 1355-470)

Рис.23. Схема последовательной пристройки /3-тяжей к abcd-струк-туре.

5. Скрученные р-р-шпилъки и $-р-уголки

Если /3-/3-шпильки - плоские или слабоскрученные (как правило, в белках они скручены так, что образуют правопропеллерную структуру, см. С1ю^1а, 1973), то какого-либо преимущества правых или левых /3-/3-шпилек нет, и в белках они встречаются равновероятно. Однако, если /3-/3-шпилька .скручена очень сильно, то, во-первых, она образует в пространстве всегда правую двойную спираль (рис. 19Ы, во-вторых, такие двойные спирали всегда образуются только правыми /3-|3-шпильками, если смотреть со стороны их вогнутых поверхностей.

Длинная /3-(3-шпилька может сломаться пополам и сложиться сама на себя так, что р-тяжи двух ее половин будут упакованы приблизительно ортогонально в двух разных слоях (рис. 191). Такой структурный мотив, названный /3-р-уголком, широко распространен в белках и

практически всегда встречается только в правой форме. Это означает, что, переходя из одного слоя в другой, полипептидная цепь образует часть витка правой суперспирали, т. е. вращается по правому винту (рис. 191). Другая важная особенность /3-/3-уголков состоит в том, что они всегда образованы правыми £-/3-шпильками, если смотреть со стороны вогнутых поверхностей.

6. .?('!-Уролох - структурный мотив большой группы 0-белков с ортогональной упаковкой (3-слоев

Структура 3/3-уголка представляем собой антипараллельный трех-тяжевой /3-лист, сложенный сам на себя таким образом, что две составляющие его /3-/3-шпильки располагаются приблизительно ортогонально относительно друг друга в разных слоях (рис. 19^. Из двух возможных форм зр-уголка в белках практически всегда встречается только правая форма, в которой центральный тяж при переходе из одного слоя в другой вращается вправо вокруг воображаемой оси суперспирали (рис. 19;)). Другая закономерность состоит в том, что первая (или Ы-концевая) /3-0-шпилька в 3/3-уголке всегда - правая, а вторая (С-концевая) - всегда левая, если смотреть со стороны вогнутой поверхности.

Проведенный нами анализ известных белковых молекул показал, что Зр-уголки всегда располагаются на краях молекул или доменов, а остальные р-тяжи упаковываются с одной и той же стороны 3/3-уголка - с той стороны, где находится вогнутая поверхность. Структуры белков этой группы могут быть получены последовательной пристройкой /3-тяжей к 30-уголку, принимая во внимание запрет на пересечение перетяжек, хиральность 30-уголка, а также принципы упаковки /3-тяжей (и а-спиралей) в компактные структуры, аналогично тому, как это показано выше для других классов белков.

7. Структурные мотивы, включающие в себя Б-образные и г-образные р-листы

Трехтяжевые 0-листы с простейшей топологией типа "вверх-вниз" могут существовать в двух "зеркально-симметричных" формах - в виде Э- и г-образных 0-листов, каждая из которых не обладает заметным преимуществом по сравнению с другой, если они рассматриваются в отрыве от структурного контекста. Однако, на уровне структур более высокого порядка, в которые они включаются или в которые они сами сворачиваются, происходит определенный отбор, и одни структуры включают в себя только Б-образные, другие - только г-образные /3- листы.

Структурные мотивы, представленные на рис. 19k, 1, m и 20с, d, g, h, включают в себя только S-образные /3-листы, если смотреть на них "изнутри" или со стороны гидрофобных ядер, в этих мотивах полипептидная цепь укладывается в виде правых суперспиралей {что легче проследить, если мысленно заменить S-образный /3-лист одним тяжем), которые можно коротко обозначить как p-S-p- (рис. 19k), p-S-a-(рис. 191), a-S-a- (рис. 19m), S-a-/3- (рис. 20с), /З-a-S- (рис. 20d), суперспирали (мотив, показанный на рис.20д, включает в себя /3-S-/3-суперспираль, а на рис.20h - p-S-a-суперспираль). Примеры белков с известными структурами, которые содержат все эти структурные мотивы, приводятся в диссертации.

На рис. 24 показаны разрешенные и запрещенные структуры, включающие в себя Z-образные /3-листы. Правый 3/3-уголок, рассмотренный в предыдущем разделе, может быть представлен как Z-образный /3-лист, сложенный сам на себя, если смотреть со стороны его вогнутой поверхности (рис. 24Ъ, с). S-Образный /3-лист в правый 3/3-уголок свернуться не может; он может свернуться в левый 3/3-уголок, но такая структура стерически запрещена и в белках не встречается. На рис.24а показан сложный вариант abed-структуры, в котором с-участок состоит из трех /3-тяжей, образующих Z-образный /3-лист, если смотреть со стороны гидрофобного ядра. S-Образный /3-лист может входить в состав сложной abed-структуры, но не с параллельной, как на рис. 24а, а с ортогональной упаковкой (3-слоев (рис. 20д). Суперспирали, включающие в себя S-образные /3-листы, не могут включать Z-образные р-листы. Так, /3- Z-/3- суперспираль

Рис. 24. разрешенные (a, b и с) и запрещенные (d, е и f) структуры, включающие в себя Z-образные /3-листы.

(рис. 24е), аналогичная /З-Б-р-суперспирали (рис. 19к), должна была бы быть левой, но левые суперспирали такого типа запрещены и в белках не встречаются. Развернутая и некомпактная структура, показанная на рис. 24с1, также не встречается в глобулярных белках, г-ос-¡3-Суперспираль (рис. 24Г), аналогичная Б-а-/3-суперспирали (рис. 20с), содержит запрещенную левую (3-а-(3- суперспираль и, следовательно, также запрещена.

8. Структурные мотивы в небольших белках и доменах

Проведенный в работе анализ показывает, что в небольших белках и доменах встречаются те же самые структурные мотивы, что и в больших белках (см. рис.19 и 20). Особо отметим тот факт, что многие небольшие белки и домены состоят, по существу, только из структурных мотивов с уникальными укладками цепей. Это указывает на то, что такие структурные мотивы достаточно устойчивы и способны свернуться в свои уникальные структуры сами по себе. Высокая частота встречаемости мотивов в различных, в том числе и негомологичных белках, также подтверждает это. В предыдущих разделах было показано, что структуры белков каждого класса можно получить последовательной пристройкой а-спиралей и(или) /3-тяжей к соответствующему структурному мотиву, учитывая простые правила. Все это вместе позволяет предположить, что структурные мотивы с уникальными укладками цепи могут быть зародышами в процессе сворачивания белков или готовыми структурными блоками, объединение которых приводит к нативной структуре белка.

V. Отбор конформации участка цепи его структурным окружением

Реальные аминокислотные последовательности очень часто содержат "избыток информации", в частности, они могут иметь больше гидрофобных, остатков, чем это требуется для образования необходимых кластеров а-спиралей или тяжей. Это может привести к тому, что один и тот же участок цепи может быть и а-спиралью, и /3-тяжем. Проведенный в работе анализ показывает, что конформация участка цепи определяется не только последовательностью данного участка, но и его структурным окружением в молекуле белка. Результаты этого анализа представлены на рис.25. Кратко их можно сформулировать так: если участок цепи упаковывается в а-спиральный слой структуры, он' должен приобретать ос-спиральную конформацию, а если он упаковывается в /9-слой, то должен приобретать (3- структурную

конформацию.

»1 с

а, с

с

а а ь е)

с! а Ь

I)

(1 <!,

д!

а Ь

с1, а, с

аз а, с

а3 а» а, с

аг а а Ь ¡1

а, [) а ь

а> Ь а Ь к|

I)

Рис.25. Схематическое изображение общих моделей С а- <3, 1) и некото-

рых примеров (е-к), показывающих, как конформация участка цепи может отбираться его структурным окружением. ос-Спирали и £-тяжи, формирующие структурное окружение, нарисованы сплошными линиями, а участки, для которых производится отбор конформации, - пунктирными линиями.

Представленные в настоящей работе результаты позволяют значительно расширить наши знания о конформационных возможностях полипептидной цепи как на уровне небольших стандартных конформации, так и на уровне супервторичных структур и структур более высокого порядка. С другой стороны, большая часть работы посвящена исследованию таких свойств полипептидной цепи, которые сильно сокращают число возможных укладок цепи в пространстве. Среди них особое значение имеют хиральность структур, запрет на пересечение перетяжек, а также" свойство полипептидной цепи укладываться в уникальные структурные мотивы. Отметим, что . все эти свойства проявляются при условии, что элементы вторичной структуры связаны между собой. На основе полученных результатов предлагается гипотеза, согласно которой структурные мотивы с уникальными укладками цепей могут быть зародышами при сворачивании белков, а остальные участки цепи пристраиваются к ним в соответствии с простыми принципами. Однако, независимо от того, по какому механизму происходит сворачивание белков, уникальные структурные мотивы могут

VI. Заключение

быть использованы в качестве стартовых структур для поиска возможных укладок полипептидной цепи в соответствии со схемами, разрабо-. танными в данной диссертации.

VII. Основные результаты к выводы

1. В результате стереохимического анализа нерегулярных участков белков обнаружен ряд неизвестных ранее небольших стандартных структур из трех-шести аминокислотных остатков и выяснены необходимые условия их образования. -Показано, что длинные нерегулярные участки в белках представляют собой различные комбинации из двух или более небольших стандартных структур. Разработан новый метод описания конформации нерегулярных участков белков и предложена их структурная классификация.

2. Проведен детальный стереохимический анализ стандартных структур типа а-спираль-a-спираль, ¿-тяж-а-спираль, а-спираль-(3-тяж, /3-тяж-/3- тяж, имеющих короткие перетяжки. Выяснены необходимые условия, которым должны удовлетворять их аминокислотные последовательности: каждый данный тип стандартных структур должен иметь строго определенное и свойственное только ему расположение в цепи ключевых гидрофобных, гидрофильных, глициновых и(или) проли-новых остатков. Fia основании этих данных можно предсказывать не только вторичную структуру, но и взаимное расположение в пространстве элементов вторичной структуры, входящих в состав таких супервторичных структур.

3. В молекулах глобулярных белков обнаружен и охарактеризован ряд неизвестных ранее структурных мотивов, состоящих из двух или более элементов вторичной структуры и имеющих уникальные укладки полипептидных цепей в пространстве. Предложена новая структурная классификация белков, согласно которой каждый отдельный класс включает в себя белки, имеющие один и тот же структурный мотив с уникальной укладкой цепи. Показано, что возможные структуры белков каждого класса можно получить последовательной пристройкой участков цепи к соответствующему структурному мотиву. Разработаны схемы поиска возможных белковых структур каждого класса. Предложена гипотеза, согласно которой структурные мотивы с уникальными укладками цепей могут быть зародышами или "готовыми структурными блоками" в процессе сворачивания белков.

4. В результате стереохимического анализа известных белковых структур, а также на основании известных принципов строени я белковых молекул сделан вывод о том, что конформация участка полипеп-

тидной цепи определяется не только аминокислотной последовательностью данного участка, но и его структурным окружением в молекуле. На конкретных примерах показано, как может происходить такой отбор конформации участка его структурным окружением.

основные результаты диссертации изложены в следующих работах:

1. Ефимов А.В. Новая супервторичная структура белков: а-а-уголок.

- Молекуляр. биология. 1984. Т. 18. С. 1524-1537.

2. Efimov A.V. A novel super-secondary structure of proteins and the relation between • the structure and the amino acid sequence. - FEBS Letters. 1984. V.166. P.33-38.

3. Ефимов А.В. Стандартные конформации полипептидной цепи в нерегулярных участках белков. - Молекуляр. биология. 1986. Т. 20. С. 250-260.

4. Ефимов А. В. Стандартные структуры в белковых молекулах. I. а-р-Шпильки. - Молекуляр. биология. 1986. Т. 20. С. 329-339.

5. Ефимов А. В. Стандартные структуры в белковых молекулах. II. (З-а-Шпильки. - Молекуляр. биология. 1986. Т. 20. С. 340-345.

6. Efimov A.V. Pseudo-homology of protein standard structures formed by two consecutive fS-strands. - FEBS Letters. 1987. V.224. P.372-376.

7. Ефимов А.В. Длинные нерегулярные участки в белках как комбинации небольших стандартных структур. . - Молекуляр. биология. 1990. Т. 24. С. 851-858.

8. Efimov A.V. Structure of a-a-hairpins with short connections.

- Protein Engineering. 1991. V.4. P.245-250.

9. Efimov A.V. Long and medium-sized irregular regions in proteins as combinations of small standard structures. - In: Molecular Conformation and Biological Interactions. Eds. Balaram P., Ramaseshan S. Indian Academy of Sciences, 1991. P.19-29.

10. Efimov A.V. Structure of coiled р-fî-hairpins and |3-/3-corners.

- FEBS Letters. 1991. V.284. P.288-292.

11. Efimov A.V. A novel super-secondary structure of p-proteins: A triple-strand corner. - FEBS Letters. 1992. V.298. P.261-265.

12. Ефимов А.В. L-Образная структура из двух а-спиралей с остатком пролина между ними. - Молекуляр. биология. 1992. Т. 26. С. 13701376.

13. Efimov A.V. Patterns of loop regions in proteins. - Curr. Opin. Struct. Biol. 1993. V.3. P.379-384.

14. Efimov A.V. Standard structures in proteins. - Prog. Biophys. Molec. Biol. 1993. V.60. P.201-239.

15. Efimov A.V. Super-secondary structures involving triple-strand /З-sheets. - FEBS Letters. 1993. V.334. P.253-256.

16. Efimov A.V. Super-secondary structures in proteins. - In: Protein Structure by Distance Analysis. Eds. Bohr H., Brunak S. IOS Press and Ohmsha, Amsterdam-Oxford-Washington-TokyoOsaka-Kyoto, 1994. P.187-200.

17. Efimov A.V. Favoured structural motifs in globular proteins.

- Structure. 1994. V.2. P.999-1002.

18. Efimov A.V. Common structural motifs in small proteins and domains. - FEBS Letters. 1994. V.355. P.213-219.

19. Efimov A.V. Structural similarity between two-layer a/p and p-proteins. - J. Mol. Biol. 1995. V.245. P.402-415.

о

Г5.03.95 г. Згк.6519Р._ Тир.125 экз. Уч.-изд.л. 2,0 Отпечатано на ротапринте в ОНТК ЛНЦ РАН