Биологический каталог




Основы ферментативной кинетики

Автор Э.Корниш-Боуден

а двойных обратных координат (разд. 10.5). Ошибка для 1/х равна

—---— = (р. — х)/х\х = — е/хр,

где р. — истинное значение х, е — ошибка измерения х. Дисперсия 1/х выражается следующим образом:

о2 (1/х) = о2 (х)/х2 и.2 « о2 (х)/х2 х2 да а2 (х)/х*. (10.9>

Расчет констант скорости

239

Последняя форма записи выражения для а2(1/х) справедлива только в том случае, когда х является наилучшей доступной оценкой р..

10.3. Простая линейная регрессия

Термин регрессия на первый взгляд означает движение назад, и уместность использования его в этом случае в статистике совсем не очевидна. На самом же деле, когда мы подбираем кривую, удовлетворяющую серии экспериментальных данных, мы надеемся, что «движемся назад» к реальной физической картине, лежащей в основе наблюдений. Например, если мы имеем серию значений переменной у, измеренных для ряда значений другой переменной, х, и допускаем, что значения у ложатся на прямую, так что

Vi = а + $xt

(индекс i показывает, что уравнение относится к определенному г-му наблюдению), то мы можем попытаться «идти назад» к значениям констант а и В, которые лежат в основе измеряемых значений у. Эта процедура называется регрессией.

Во всех реальных экспериментах измерения производятся с определенной ошибкой, и поэтому мы не можем рассматривать каждое измеренное значение у как точную меру (а 4- ^хг), согласно записанному выше выражению. Вместо этого мы имеем

yt=a + fri±*t, (Ю.Ю)

где е i — ошибка измерения у j (предполагается, что для х { ошибка равна 0). К сожалению, значения е t неизвестны, и они остаются неизвестными независимо от того, сколько проводится измерений и как тщательно они анализируются, потому что число неизвестных всегда на 2 больше, чем число уравнений. Следовательно, мы никогда не сможем рассчитать а и В. Все, что удается сделать в этой ситуации, — это определить наиболее вероятные значения а й В, введя некоторые допущения о природе величин е

Прежде всего перепишем уравнение (10.10) так, чтобы оно было выражено через известные величины:

yt = a + bxi + ei, (10.11)

где a, b и et — вымышленные величины, являющиеся некоторым приближением к истинным значениям а, В и eiv Чтобы не слишком усложнять выражения, индексы i в остальной части главы опущены (за исключением случаев4 когда они необходимы для ясности картины). Аналогичным образом во всех суммах знак 2 будет означать суммирование по всем наблюдениям, т. е. от ? = =1 до i = п. Значения е называют отклонениями (или остатками),

240

Глава 10

а не ошибками, потому что они не обязательно должны быть равны истинным ошибкам е. Как объяснялось в предыдущем разделе, это чересчур строгое разграничение истинных и оцененных величин необходимо для внесения ясности при обсуждении теории регрессии. Если эксперимент не дает разброса, иначе говоря, если допустить, что среднее значение для распределения значений е равно нулю, естественно предположить, что а и Ъ будут наилучшими приближениями для а и В в том случае, когда достигнуто минимальное общее отклонение. Дадим прежде всего более точное определение расплывчатому (что сделано с умыслом) термину «общее отклонение». Проще всего, очевидно, задать его как 2е. Однако такое определение не корректно, поскольку оно не дает однозначных значений а и Ь. Действительно, для любого а существует значение Ъ, при котором 2е =0, поскольку в сумму входят как положительные, так и отрицательные члены, которые могут компенсировать друг друга; таким образом, из равенства суммы нулю нельзя сделать вывод о том, что данные описаны наилучшим образом. Эту трудность можно обойти, если не учитывать знака е и минимизировать сумму абсолютных значений ошибок или сумму квадратов ошибок 2е2. Использование 2|е| в качестве меры того, насколько хорошо описаны данные, не встречает принципиальных возражений, однако при решении любых практических задач (за исключением самых простейших) оказывается, что такой подход ведет к чрезвычайно сложным алгебраическим выражениям. Поэтому минимизируют 2е2, которая называется суммой квадратов. (Во многих элементарных руководствах настоятельно рекомендуют пользоваться суммой квадратов, утверждая, что она обладает принципиальными преимуществами перед другими критериями. Однако при ближайшем рассмотрении оказывается, что, хотя логические рассуждения выглядят безупречными, лежащие в их основе предпосылки неверны и обычно включают ряд явно ошибочных утверждений о природе экспериментальной ошибки. Вернее и безопаснее всего принять, что главное достоинство суммы квадратов состоит в том, что она просто, более удобна для проведения алгебраических выкладок.)

В некоторых случаях a priori известно, что одни измерения более точны, чем другие. Тогда при рассмотрении вопроса о том, насколько оптимальным является описание результатов наблюдений, логично брать более надежные измерения с большим весом. Поэтому обычно лучше минимизировать не просто сумму квадратов 2е2, а сумму взвешенных квадратов SS — 2и>е2, где каждое значение w представляет собой весовой множитель. (Предполагается, конечно, что нам известно, как рассчитать веса измерений.) При нахождении средневзвешенного серии значений нетрудно показать, что дисперсия среднего минимальна в том случае, если вес каждого значения обратно пропорционален его дис-

Расчет констант скорости

241

персии. Это верно и для более общей задачи, при описании данных с помощью любого уравнения. [Сделанное заключение справедливо только в том случае, если ошибки измерений не коррелируют между собой, т. е. cov (ег, е7) =0 для всех i^=j. Вряд ли это допущение строго выполняется, однако его приходится принять, поскольку в противном случае рассчитать веса становится очень трудно.] Точные значения дисперсий данных, как правило, неизвестны, однако зачастую удается сделать правдоподобные заключения о том, как экспериментальная ошибка связана с измеряемыми величинами. Описание невзвешенных значений при помощи прямой непригодно для любых данных ферментативной кинетики. Поэтому в выражение для суммы квадратов всегда должны входить веса.

Преобразуя уравнение (10.11), получаем

е = у — а — Ъх. '

Сумма квадратов выражается следующим образом:

SS = = 2> (у — а — bxf.

При любом Ъ величины SS и а связаны квадратным уравнением, и поэтому зависимость SS от а представляет собой параболу. Наклон касательной к этой параболе в любой точке равен

6SS

да

= — 2^w(y—а — Ьх) = — 2^wy +2a%w + 2b^wx,

Аналогичным образом можно получить, что при любом а наклон касательной к кривой, представляющей графически зависимость SS от Ъ, определяется следующим выражением:

= — 2 ^wxy + 2а 2>я + Zb^wx*.

дЬ

Для того чтобы величина SS была минимальна, оба наклона должны быть одновременно равны нулю. Поэтому если определить а и b как значения а и о, при которых SS достигает минимума, то мы получим

a^->w -\-b^wx = ^>wy

чох 4- b S wxz = S wxy

Эту систему простых уравнений (иногда называемых нормальными уравнениями) довольно просто разрешить относительно

неизвестных а и Ъ:

Ъ = D w D wxy ~ D wx D шу , (10.13)

(10.12)

2 2 wx2—(2 ю*)

242

Глава 10

а= . (1014)

Данные соотношения удобны для расчета а и 8, однако из них

непосредственно не видно, как найти дисперсию а и Ъ. Все же, проявив небольшую изобретательность, мы можем преобразовать уравнение (10.13) к следующему виду:

g = х )

wy

2(х — х) WX

(10.15)

где х = Hivx/Hiv — средневзвешенное значений х. Это уравнение типа

иу, (10.16)

в котором и — постоянная, определяемая следующим выражением:

и = («-"Ь" . (10.17) 2 (х — х )wx

Поскольку, как предполагается, ошибки значений у не коррелируют между собой, дисперсию величины Ъ можно найти, применив обобщенную форму уравнения (10.5) к уравнению (10.16):

o2(b) = Su2o2(y). (10.18)

Каждый вес w по определению обратно пропорционален а2(у), и мы можем записать: а2(у t) =о2эксп/и^, где ст2эксп— постоянная величина, не зависящая от i и называемая экспериментальной дисперсией. Уравнение (10.18) можно поэтому представить следующим образом:

Ab) = <*L?u*'w- (10.19)

После довольно скучных, но несложных алгебраических преобразований получаем

о2(ь)

w

- . (10,20) 2j w 2j wx — \2j wx)

Хотя это уравнение имеет более сложный вид, чем уравнение (10.19), им удобнее пользоваться, поскольку оно содержит только суммы, которые входят также в уравнение (10.13). Таким образом, для определения о2(Ь) требуются лишь незначительные рас-

Расчет констант скорости

243

четы в дополнение к тем, которые необходимы для определения Ь.

Аналогичным образом можно получить выражения для дисперсии а и ковариации а и Ъ. Они имеют следующий вид:

cov(a, b) = —-— .2. (10.22) 2jw 2j wx — \2j wxi

Во все эти уравнения входит неизвестная величина ст2эксп, которую, однако, можно легко рассчитать из суммы квадратов: °"2эксп ~ SS/(n—2). Величину SS делят на (п—2), а не на п, чтобы ввести поправку на смещение, связанное с тем, что SS является минимальной величиной и поэтому меньше истинной величины Sire2 [см. уравнение (10.2)].

Отметим, что ни одно из уравнений (10.13) — (10.22) не является симметричным относительно а; и у, и поэтому регрессия х на у должна давать такую наилучшим образом проведенную прямую, которая отличается от соответствующей прямой для регрессии у на х. Эта асимметрия заложена в исходном допущении о том, что у (но не х) измеряется с ошибкой, т. е. отклонения от прямой измеряются в направлении, параллельном оси у, а не перпендикулярном прямой, как можно было бы полагать. Может показаться, что измерение ошибок в направлении, перпендикулярном прямой, позволяет избежать необходимости в выборе допущения о том, какая переменная измеряется с ошибкой. Однако на деле такой способ измерения ошибки создает гораздо большие трудности, не способствуя решению проблемы: помимо того что при этом усложняются алгебраические выкладки, проведенная оптимальным образом прямая изменяется в зависимости от того, в каких единицах измеряются х и у, потому что длины отрезков, проведенных на графике, имеют разумную размерность только в том случа

страница 46
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55

Скачать книгу "Основы ферментативной кинетики" (3.56Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]

п»ї
Rambler's Top100 Химический каталог

Copyright © 2009
(20.06.2019)