Биологический каталог




Пептидная саморегуляция живых систем (факты и гипотезы)

Автор Л.К.Шатаева, В.Х.Хавинсон, И.Ю.Ряднова

орого они обмениваются посланиями. По-видимому, для такой расшифровки необходимо знать тему и предметность, с которой ассоциирован текст.

В свое время для расшифровки кодированных текстов был разработан статистический метод отыскания стационарных участков в последовательности кодирующих знаков. В работах К. Шеннона (1963) и Н. Винера (1983) ставилась определенная цель: предсказать последовательность букв в тексте, когда, например, половина из них отсутствует, но есть частотные характеристики их парных, триграммных и тет-раграммных сочетаний.

Со времен пионерской работы Шеннона функция распределения вероятностей в линейной последовательности знаков используется для оценки информационной нагрузки на один знак. В качестве меры упорядоченности и информационной значимости отдельных элементов (букв) текста было принято изменение энтропии последовательности при переходе от случайного распределения элементов в цепи к распределению, учитывающему количество повторов одних и тех же сочетаний букв в данной последовательности. Мы будем пользоваться этим методом при исследовании аминокислотных последовательностей нескольких регуляторных полипептидов.

Вычисление состоит из ряда приближений F0, Fx, FN, которые Шеннон назвал /У-граммной энтропией, так как она учитывает на каждом этапе более определенные статистические связи между /V аминокислотными остатками. Следует подчеркнуть, что этим связям не приписывается никакого энергетического содержания, так же как мы не рассматриваем энергию связи между буквами написанного

91

слова. Семантическое содержание, т. е. значение, отражающее определенную физическую сущность, также не имеет отношения к количеству информации, вычисляемой для данной последовательности (Shannon, 1951).

Энтропия FN для коротких последовательностей рассчитывается из обычных частотных таблиц отдельных знаков, диграмм, триграмм и тетраграмм. Для удобства дальнейших количественных сопоставлений энтропия последовательности вычисляется в битах, т. е. с использованием логарифмов по основанию 2.

Для аминокислотного «алфавита» из 20 букв, т. е. для кодируемых 20 аминокислот, нулевое приближение составляет

FQ = log2 20 = 4.32 бит/остаток

в предположении, что все аминокислоты встречаются в составе белка с равной вероятностью (Шеннон, 1963). Однако, как мы увидим, в природных пептидах этого не бывает.

Анализируя распределение вероятности для отдельных аминокислот и их сочетаний в составе каждого белка, можно оценить усредненное изменение энтропии, приходящееся на один аминокислотный остаток, как разницу /У-граммной и (N ~ 1)-граммной энтропии. Изменение TV-граммной энтропии, Д FN, при добавлении к блоку еще одного остатка измеряет количество информации, которое приходится на добавленный остаток, и рассчитывается по формулам (Шеннон, 1963):

FN=-Ip(bi) log2рф.\

AFN=-Zp{bi,j) log2p(bi,j) + lp{bj) log2p(Z>,.),

где bt — блок из (N— 1) остатка; p(b) — вероятность блока bp определяемая из частоты его появления; j — аминокислотный остаток, следующий за блоком b., p{bp j) — вероятность блока из N остатков; AFN — среднее значение энтропии одного аминокислотного остатка при его добавлении к предыдущим (/У- 1) остаткам.

Вычисления были проведены для нескольких регуляторных полипептидов с длиной последовательности 165—482 аминокислотных остатков (а. о.). Они значительно короче той длины (2.9 млн. а. о.), которая была использована в работе Вейса (Weiss et al., 2000), но достаточны для статистических оценок. В табл. V Приложения представлены их аминокислотные последовательности.

92

Нейроспецифический кальмодулин-связывающий белок Р-57 был выделен из мембран мозга. Этот белок характеризуется отсутствием упорядоченных участков цепи с ос- или Р-структурой, и почти половина его аминокислотных остатков имеет гидрофильный характер. Вероятно, он составляет внешнюю часть мембранного рецептора (Wakim et al., 1987).

Тропонин Т — одна из субъединиц белка тропонина, регулирующего сократительную активность актомиозина в полосатой мышце. В отличие от предыдущего белка три четверти аминокислотных остатков тропонина Т включены в состав ос-спиральных участков; 50 % аминокислотных остатков имеют ионогенные боковые группы (Leszyk et al., 1987).

Фактор роста эпителиальных клеток, выделяемый тромбоцитами (PDECGF), существенно отличается по молекулярной массе и аминокислотному составу от сосудистого фактора роста эпителиальных клеток (VEGF), хотя их физиологические функции достаточно близки (Fteldin et al., 1991). Расчет выполнен также для нейротрофического фактора из глиальных клеток (GCDNF), стимулирующего рост допаминэргических нейронов (Lin et al., 1993), и для мембранного рецептора аквапорина 0, свойства которого мы рассмотрим в разделе 2.2 (Nemeth-Cahalan, 2000). Частотные характеристики аминокислотного состава этих белков были представлены в табл. 6.

Расчет FN проводили для аминокислотной последовательности каждого белка, читая ее слева направо (от N- к С-концу) и разбивая на блоки по 2, 3, 4 и 5 остатков; аналогично тому, как это было сделано для суммарной последовательности тканеспецифических пептидов в разделе 1.4.1, определяли частоту появления каждой /V-граммы (Шатаева и др., 2002).

В табл. 8 представлены результаты расчета FN (N = 1, 2, 3, 4, и 5) для выбранных белков, а также повторяющиеся (устойчивые) блоки аминокислотных последовательностей в их структуре. Для всех указанных аминокислотных последовательностей значение меньше теоретического значения 4.32 бит/остаток для равновероятного содержания аминокислот в пептиде. Из-за неодинаковой частоты включения аминокислотных остатков в цепь (селективность встраивания аминокислоты в цепь) первичная структура природного пептида оказывается более информативной, чем модельный пептид, содержащий все аминокислоты поровну.

При перечислении содержащихся в последовательности пар аминокислотных остатков в качестве знаков мы факти-

93

Таблица 8

Средняя информационная нагрузка на аминокислотный остаток (а. о.) в составе регуляторных белков

Число остатков в N-грам-ме бит/блок бит/остаток Повторяющиеся блоки /',v, бит/блок д/v, бит/остаток Повторяющиеся блоки

Глиальный нейротрофический Белок Р-57, п = 239 а. о.

фа к гор (GC DNF), г = 211 а. о.

1 4.08 -0.24 A, L, D, S, R 3.51 -0.81 А, Е, D, G, R

2 7.00 2.92 DD. KR, RG, 6.51 3.0 АЕ, АР, ЕА,

RR ED, ЕР

3 7.64 0.64 AAA, KRL, 6.84 0.33 АРА, AED,

QAA, TSD АЕА

4 7.66 0.02 LTSD, QAAA 7.84 1.0 AEDA, АРАА,

DAPA

5 — — Нет 7.79 -0.05 АРААЕ

Фактор роста эндотелия сосудов Тромбоцитарный фактор рос-

(VEGF), п = 165 а. о. та эпителиальных клеток

(PDECGF), п = 482 а. о.

1 4.09 — Е, С, R, К, 3.82 — А, Е, G, L.

Р, 0, F, S R, V

2 6.88 2.79 КР, SC, CR, 7.26 3.44 АА, AL, LV,

RC, RQ, RV

GG

3 7.24 0.36

страница 26
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65

Скачать книгу "Пептидная саморегуляция живых систем (факты и гипотезы)" (1.73Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]

п»ї
Rambler's Top100 Химический каталог

Copyright © 2009
(23.08.2019)