Регистрация полученных данных. Статистическая обработка результатов исследования

Видео: К. Авилов "Статистика и статистическая обработка данных в биомедицинских исследованиях"

Полученные данные регистрировали в виде выписок из историй болезни, спирограмм, допплерограмм, реовазограмм, фотографий, видеоматериалов, записей на магнитных носителях, индивидуальных карт исследования пострадавших с сочетанной травмой.

Статистическая обработка результатов исследования

При сравнении выборочных средних значений параметров исследуемых групп, имеющих нормальное распределение, использовали оценку с помощью критерия Стьюдента, или Т-критерия. Проверяемый T-критерий выражается в виде отношения разности средних значений выборок к ошибке данной разности:

rsoch_020.jpg
и M2 - выборочные средние значения параметров сравниваемых групп, а od - стандартная ошибка разности выборочных средних значений.

Так как в данном исследовании сравнивались как равночисленные, так и не равночисленные выборки, стандартную ошибку рассчитывали по формуле:

rsoch_021.jpg
где n1 и n2 - объем выборок первой и второй сравниваемых групп соответственно.

По рассчитанному Т-критерию и числу степеней свободы f=n1+п2-2 по таблице определяли уровень значимости Р. Уровень значимости определяется при помощи доверительной вероятности. Доверительной вероятностью называют вероятность, которая признается достаточной для уверенного суждения о параметрах генеральной совокупности на основании известных  выборочных  показателей.  Обычно  в медико-биологических исследованиях достаточным является значение доверительной вероятности 95%, или 0,95. Иначе говоря, параметр генеральной совокупности попадает внутрь интервальной оценки, построенной с использованием выборочных средних значений с вероятностью, превышающей 95%. При этом вероятность выхода истинного значения параметра за пределы границ не превышает Р = 1 - 0,95 = 0,05, или 5%. Таким образом, различие средних значений подтверждается, если уровень значимости P не превышает 0,05.

При статистической обработке данных клинических исследований был использован метод сравнения доли признака в двух совокупностях.

Проверяли нулевую гипотезу Н0 о равенстве генеральных долей признака Н0: pl = р2. Для этого были взяты две независимые выборки объемом ni и n2. Выборочные доли признака равны соответственно wi=mi/nl и w2=m2/n2, где ml и m2 - соответственно число элементов первой и второй выборок, обладающих данным признаком.

При достаточно больших nl и n2, выборочные доли wl=ml/nl и w2=m2/n2 имеют приближенно нормальный закон распределения с математическими
ожиданиями, или средними величинами, pl и р2 и дисперсиями  rsoch_022.jpg

rsoch_023.jpg
При справедливости гипотезы Н0:


pl = р2 =Р разность wl - w2 имеет нормальный закон распределения с математическим ожиданием M(w1-w2)=p-p=0 и дисперсией

rsoch_024.jpg
Поэтому статистика

rsoch_025.jpg
имеет нормальное распределение N(0-1).

В качестве известного значения Р, входящего в выражение для статистики t, берут ее наилучшую оценку, равную выборочной доле признака, если две выборки смешать в одну, т.е.



rsoch_026.jpg
Границы доверительного интервала выбирают по такому же правилу, как и в случае сравнения выборочных средних значений, т.е. при доверительной вероятности 0,95, при конкурирующей гипотезе Hl. Если t < t095, то гипотеза Н0 о равенстве долей признака принимается, если t > t095, то нулевая гипотеза отвергается и принимается конкурирующая гипотеза Hl, а доли признака считаются различными.

Для сравнения данных параметров вариационных рядов использовали корреляционный анализ. Понятие корреляции отражает связь между параметрами вариационных рядов. Наглядно такую связь легко представить, если отобразить на координатной плоскости значения одного ряда по оси абсцисс, а другого - по оси ординат. В случае наличия связи между параметрами рядов точки, общее количество которых равно числу наблюдений, будут образовывать некоторую кривую (чаще прямую), которая и отображает взаимозависимость параметров.

На практике же исследователя интересует не сама зависимость одной переменной от другой, а теснота связи между исследуемыми параметрами, которую можно выразить одним числом. Эта характеристика называется коэффициентом корреляции. В случае корреляционного анализа два рассматриваемых вариационных ряда считаются равноправными в причинном смысле. Силу и выраженность линейной зависимости между двумя случайными величинами X1 и X2 , имеющими нормальное распределение, обычно оценивают с помощью коэффициента корреляции Пирсона, который рассчитывается по формуле:

rsoch_027.jpg
где X1i  и X2i  - соответствующие значения параметра в 1-наблюдении, а X1 и X2 - средние значения рядов, состоящих из n наблюдений.

Величина коэффициента корреляции всегда заключено в пределах -1 < r < 1 . Если r < 0, то это значит, что с увеличением в вариационном ряду наблюдаемых величин  X1   соответствующие им значения  X2 второго вариационного ряда в среднем уменьшаются. Если r > 0, то с увеличением
значений одного параметра другой параметр также в среднем возрастает. Если r = 0, то это значит, что параметры X1 и X2 абсолютно независимы.

При r = l между параметрами существует прямо пропорциональная функциональная зависимость, что для медико-биологических исследований встречается крайне редко. Чем больше абсолютная величина коэффициента корреляции, тем при данном объеме выборки больше доверительная вероятность того, что характер связи действительно соответствует полученному коэффициенту корреляции.

Вычисленный коэффициент корреляции является выборочной оценкой коэффициента корреляции генеральной совокупности, а значит, как и любая случайная величина, имеет ошибку sr. Отношение выборочного коэффициента корреляции к своей ошибке является критерием для проверки нулевой гипотезы о равенстве нулю коэффициента корреляции генеральной совокупности, или соответственно о независимости случайных величин X1 и
X2

rsoch_028.jpg
Число степеней свободы для проверки критерия равно f = n - 2, гипотезу проверяют по таблицам распределения Стьюдента в соответствии с выбранным уровнем значимости. Если вычисленное значение превзойдет или окажется равным соответствующему табличному значению, нулевую гипотезу отвергают.

При выборках малых объемов (n < 30) расчет коэффициента корреляции по приведенным выше формулам дает заниженные оценки соответствующего параметра генеральной совокупности. В таком случае лучше применять z-преобразование Фишера:

rsoch_029.jpg
Переменная z принимает свои значения в интервале от - до + бесконечности, распределение этой величины приближенно нормальное. Тогда критерием достоверности является показатель:

rsoch_030.jpg
По таблице распределения Стьюдента для выбранного уровня значимости Р и числа степеней свободы f = n -2 проверяют нулевую гипотезу о том, что в генеральной совокупности этот параметр равен нулю. Гипотезу отвергают на выбранном уровне значимости, если tz превзойдет соответствующее табличное значение.

Качесов В.А.
Похожее